头部创业公司中,与 DeepSeek 官方产品形态相似的 Kimi (月之暗面)暂未接入 DeepSeek。OpenAI 近期发表的一篇关于思维链的论文里提到了两个来自中国的模型,一个是 DeepSeek-R1,一个就是 Kimi-k1.5。一位接近月之暗面人士称,"都是推理模型,又都有比肩 o1 的表现,这可能是月之暗面还未接入 DeepSeek 的主要考量。"
不论大公司还是创业公司,都一边接入 DeepSeek ,一边在迅速迭代自己的模型。就在今天,腾讯在接入 DeepSeek-R1 的元宝中也上线了自研推理模型混元 T1 ,称 "用户可以选不同的模型,解决复杂问题"。这更像互联网公司都熟悉的赛马。
彻底的开放,成就最大的商业奇迹
"一家非美国公司正在延续 OpenAI 的初心--真正开放、前沿的研究,赋能所有人。"DeepSeek 开源 R1 模型后,英伟达 AI 科学家吉姆·范(Jim Fan)说,DeepSeek 不仅开源一系列模型,还公开训练秘诀。
同一时间,Meta 首席科学家杨立昆(Yann LeCun)也说,外界不要只关注中美 AI 竞争,DeepSeek 更重要的价值是 "开源对闭源的胜利"。
DeepSeek 之前,中美都有大模型公司开源模型,其中 Meta 的 Llama 系列模型迅速扩散,让 Google 一位资深研究员声称,OpenAI、Google 等模型闭源公司都没有护城河。但最后填上护城河的是 DeepSeek。
DeepSeek 比肩第一梯队闭源模型的性能和较低的训练和部署成本,是它的内核与爆发基础。
更深入的开源则给它带来 "魔法加成":从第一个自研大模型 DeepSeek LLM 至今,它一直开源自己最好的模型,而且一直用自由度最高的开源协议之一 "MIT 开源协议",允许开发者自由下载使用、修改发布,用于商业用途也不需要付费。相比一批开源转闭源的公司,如 Mistral 等,DeepSeek 到目前为止保持一贯的开源动作。
与 Meta、阿里相比,DeepSeek 更中立:它没有像 OpenAI(与微软)、Anthropic(和亚马逊)那样,与某家大公司绑定,也没有引入任何投资方。
在各类公司决定是否接入 DeepSeek 的决策中,这是一个与模型性能、开放程度同等重要的因素。
开源之路在之前对中国创业公司来说几乎不是一个选择。
"DeepSeek 说明这条路(开源)能走通。如果在以前,一个拿几亿美金融资的公司说自己要开源,估计投资人会吐血。" 一位投资人说。据我们了解,至少有两家此前闭源的大模型公司接下来可能会开源自研的领先模型。
DeepSeek 不是一家典型的创业公司,它做大模型的路径不是从 0 开始,以融资撬动未来回报,而是基于幻方成立 9 年的积累。在相对充足的资金、算力环境下,实践大部分人不看好发展路径,这是它到现在为止极致开源、开放的基础。
梁文锋对 Open 的 AI 有多执着?一个小故事是,2023 下半年,硅基流动(SiliconFlow)筹备期间,梁文锋想要投资,但说 "如果 LLM 推理引擎不开源就没兴趣了"。硅基流动创始人袁进辉后来分享,当时他并没有想明白开源的商业模式,就没拿这笔钱。
一位头部大模型公司人士最近看到这个故事感慨说:"梁文锋真是太疯了!"