中美科技差异缩小
随着中国公司陆续发布兼具性能与价格优势甚至开源的大模型,中美在人工智能上的差距正在缩小。斯托伊卡表示,"我认为这一趋势已经非常明显了。根据LLM Arena的结果,在过去的一年里,中国的开源模型从垫底者一跃成为排行榜上的佼佼者,至少在Meta发布其新的Llama模型之前是这样。"
很多反馈显示,DeepSeek的动作让Meta的生成式AI团队"陷入恐慌"。Meta CEO扎克伯格宣布加速研发Llama 4,计划投资650亿美元扩建数据中心,并部署130万枚GPU以"确保2025年Meta AI成为全球领先模型"。
不过,多名接受第一财经记者采访的专家表示,仍需要关注中国的人工智能实现"从0到1"的能力。
以DeepSeek-V3为例,根据其技术报告,该模型的正式训练成本约为558万美元,但这一数据并不包括架构、算法、数据相关的前期研究和消融实验的成本。而对于大模型训练来说,尽管无效路径和探索会浪费大量算力,但没有这种"浪费"也难以取得最后的突破。
刘鹏飞表示,目前看来DeepSeek的大模型起到了加速创新的作用,但这种创新目前只在对从1到10的"复现"类工作得到验证。
"中国的复现是很快的。" 刘鹏飞表示"复现"的难度低于做"新发现"级别的难度。未来中国的人工智能研究者需要更加关注从0到1的工作。
也如清华大学计算机系长聘副教授刘知远所说:"AGI新技术还在加速演进,未来发展路径还不明确。接下来如何在迷雾中开拓新路,才是更大的挑战。"
谭寅亮也对第一财经表示,中国跟美国目前在人工智能上的差距,在最前沿大模型上,存在着6个月到9个月的差距,但多种大模型之间的良性竞争,能更好地促进人工智能在全世界的使用。