DeepSeek更新了!5个问题,深度测评!内附体验方式!



DeepSeek V4 发布亮点·极速版
▸ 1M 超长上下文 —— 从 128K 跃升 8 倍,一次读完三体三部曲
▸ 首字速度 0.8s —— 响应快 65%,对话如流
▸ 多模态文件理解 —— 支持图像、表格、批量 OCR,不止文字
▸ 实时联网搜索 —— 语义增强,主动整合最新信息
▸ 深度反思链推理 —— 自我纠错,数学/代码准确率 +42%
架构重塑
• 深度 MoE++:动态共享专家,激活效率 3 倍提升
• 无限透镜注意力:1M 内存占用降低 60%,长文无损
• FP8 训练引擎:速度 2.1 倍,千卡通信减 43%
• 多 Token 预测:4 步并行,解码提速 80%
• 显存织物:动态卸载,显存节省 50%,20B 模型消费级显卡流畅跑
一句话总结:从“工具”到“伙伴”,记忆更长、眼睛更亮、脑子更快 —— 完全免费,即刻拥有。
还有一些细节内容,比如这次知识库更新到2025年5月。也就是说,这是一个全新训练的基础模型。
整体语言风格也有了很大改变,不再是以前那种拟人的,现在更简练,更直接。思考过程也做了裁剪,不像以前会自己嘀咕 "用户好像生气了",这样的变化有利有弊吧,可能很多人有些不太适应。
由于官方正式博文还没发布,所以模型跑分结果不知道,那我们就自己测测!
模型能力实测!看看到底强不强!
第一题,热门陷阱问题!
我们先来个最近很火的问题,豆包和qwen都翻车了,看看新版deepseek如何。问题如下:
我家门口20米有个洗车店,你说我是开车过去,还是走过去洗车?
正确答案:开车过去,因为我要洗车!
回答正确!deepseek新版回答的不错,识别到了陷阱,通过测试!

第二题,超长文本处理能力测试!
接下测试一下长文本处理能力,我做了个50w字的文档。

在其中插入一段话,看看它能否理解,并回答正确









