【文/观察者网 阮佳琪】
深度求索(DeepSeek)新品重磅发布,再度引爆AI圈。12月1日,中国人工智能(AI)初创企业DeepSeek推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
据介绍,DeepSeek-V3.2定位"平衡实用",其在主流推理基准测试中达到美国OpenAI的GPT-5水平;而在推理能力上大幅增强的DeepSeek-V3.2-Speciale,则在推理基准测试中取得了媲美谷歌深度思维11月下旬刚推出的新一代AI模型"双子座3专业版"(Gemini 3.0 Pro)。
DeepSeek还透露,其V3.2-Speciale版本在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现。这一成绩直接对标行业巨头,此前仅有OpenAI和谷歌深度思维未对外公开的内部测试模型达成过这一成就。
香港《南华早报》2日报道指出,这一来自开源实验室的技术突破再次引发AI研究领域的广泛热议,尤其DeepSeek此次上新恰逢"AI界的奥斯卡"--2025年神经信息处理系统大会(NeurIPS)召开前夕。
作为当前全球最负盛名的机器学习和AI研究领域顶尖学术会议之一,NeurIPS大会每年举办一次,被中国计算机学会列为A类会议,在谷歌学术发布的全球学术期刊和会议影响力排名中位列第7,与国际机器学习会议(ICML)、国际学习表征会议(ICLR)并称为AI领域难度最大、水平最高、影响力最强的三大会议,代表着当今机器学习与AI领域的最高水平。
尽管向来行事低调的DeepSeek尚未公布是否会派员参会,但正在圣地亚哥参加NeurIPS大会的弗洛里安·布兰德(Florian Brand)已难掩兴奋。
这位专门研究中国开源AI生态系统的专家告诉港媒,如果DeepSeek的研究人员现身会场,大概率会引发高度关注。
他还透露:"DeepSeek发布新模型的消息一出,今天所有相关交流群都炸开了锅。(All the group chats today were full after DeepSeek's announcement)"
港媒还提到,本届NeurIPS大会首次采用双会场形式,在美国加州圣地亚哥和墨西哥首府墨西哥城同步举办。这一安排主要源于主办方对国际研究人员获取美国签证可能遇阻的担忧,目前已有许多中国参会者选择前往墨西哥城会场参会。

DeepSeek-V3.2及其同类产品的基准测试。截图自DeepSeek技术报告
据官方介绍,DeepSeek-V3.2定位平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。在公开的推理类基准测试(Benchmark)中,V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。
DeepSeek评价称,V3.2"在智能体评测中达到当前开源模型最高水平",大幅缩小了开源模型与闭源模型的差距,且未针对测试工具进行特殊训练。此外,该模型还是DeepSeek推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。
DeepSeek-V3.2-Speciale则为"极致推理"而生,是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力,以探索模型能力的边界。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。
更令人瞩目的是,V3.2-Speciale成功斩获国际数学奥林匹克(IMO 2025)、中国数学奥林匹克(CMO 2025)、国际大学生程序设计竞赛全球总决赛(ICPC World Finals 2025)及国际信息学奥林匹克(IOI 2025)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。
目前,DeepSeek官方网页端、App和API均已更新为正式版V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。相关模型已开源。

截图自DeepSeek技术报告
与两款新模型同步发布的,还有配套的技术报告。谷歌深度思维的首席研究工程师苏珊·张(Susan Zhang)在社交媒体上对此给予好评,称赞报告内容详尽,同时肯定了这家初创企业在模型训练后稳定性优化及智能体能力提升方面的努力。
彭博社指出,这一成果已清晰表明,中国开源AI系统至少在部分核心指标上,已经与硅谷顶尖专有模型具备同等竞争力。
美媒进一步解读称,此次新品发布也释放出一个重要信号:继今年1月推出突破性模型颠覆AI领域后,这家颇具影响力的AI实验室正持续加大研发力度,致力于提升AI运算的速度与效率,力求巩固其在中国AI赛道中的领先优势。
就在上周,DeepSeek刚发布了开源模型DeepSeek-Math-V2,该模型展现出强大的数学定理证明能力。
开源AI初创公司Hugging Face的联合创始人兼首席执行官克莱门特·德朗格(Clement Delangue)在社交平台X上盛赞道,"想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。"
他强调,用户可以不受限制地探索、微调、优化这款中国AI模型,并在自有硬件上运行,"没有任何公司或政府可以收回它。这正是AI和知识民主化的最佳体现。"
"据我所知,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。"德朗格补充说。
另据英国《金融时报》上周报道,美国麻省理工学院(MIT)和Hugging Face的一项研究发现,过去一年,中国团队开发的开源AI模型下载量占比上升至17%,超过了美国开发团队的15.8%。这是中国团队首次在这一指标上超越美国同行,取得AI技术全球应用中的关键优势。
在席卷全球科技行业的AI热潮之中,美国OpenAI、谷歌和Anthropic等科技巨头倾向于"封闭"策略,保持对先进AI技术的完全掌控,通过用户订阅和企业合作等方式获利。与之相比,中国科技公司倾向于更加开放的策略,发布了一系列开源模型。
德国智库墨卡托中国研究中心的高级分析师温迪·张(Wendy Chang)指出,"比起美国,开源在中国更像是一种主流趋势。美国公司不愿这样做,它们依靠这些高估值赚钱,不想公开自己的商业机密。"
根据MIT和Hugging Face的数据,DeepSeek和阿里云的Qwen是下载量最多的中国开源模型。《金融时报》称,DeepSeek-R1模型震惊了硅谷,该模型使用的成本和算力很低,但性能足以与美国顶尖模型比肩,引发各界对于美国AI实验室是否还能保持竞争优势的质疑。
MIT研究员谢恩·隆普雷(Shayne Longpre)表示,中国科技公司正在改变AI模型发布的范式,许多中国公司每周或每两周发布一次模型,并提供多种版本供用户选择。相比之下,美国科技公司往往每六个月或一年才发布一系列模型。
业内人士告诉《金融时报》,尽管美国出台了芯片出口管制等一系列打压措施,但中国拥有大量优秀人才,他们在开发开源模型的过程中展现出极强的创造力。
"当美国AI实验室押注于通过推动智能突破来获取巨额利益的同时,中国的开源模型竞争者更专注于推动AI的广泛应用,"《经济学人》总结道,"如果他们成功,DeepSeek的冲击可能仅仅只是一个开始。"










