又被 DeepSeek 偷袭了!
业内苦等的 R2 模型迟迟未到,结果 DeepSeek 却悄然出手:
DeepSeek R1 摇身一变,成了 DeepSeek-R1-0528!
依然是开源、依然赶在节前,这次的更新不改大版本号,只低调地加上日期,延续了 DeepSeek 一贯的命名套路,就像两个月前的 DeepSeek-V3-0324。
别看名字没变,这波 R1 版本的升级可不简单,特别是在"复杂推理""前端开发""幻觉降低"等方向,带来了实打实的进化。
这次的 DeepSeek-R1-0528 还是沿用了 2024 年 12 月发布的 DeepSeek V3 Base 模型,只不过这次后台"砸"了更多算力,让它能像人一样多想一步、再多想一步。
打个比方,用"tokens"来衡量它的"思考量":
同样是做 AIME 2025 测试,旧版 R1 平均每题只要 12K tokens 就交卷,新版 R1-0528 则要跑到 23K tokens 才满意。
也就是说,DeepSeek-R1-0528 会把题目拆得更细、更透。
思考用料足了,答案自然更准:准确率从原来的 70% 一口气飙到了 87.5%。