DeepSeek:技术开放成就商业奇观(4)

2025-02-18 10:52  头条

在此期间,凭借自研大模型获得高额融资的部分创业公司,如 MiniMax、阶跃星辰,也都在旗下个人应用中引入了 DeepSeek。

这种状况与两年前大模型行业的主流观点截然相反。那时大模型在中国掀起热潮,大多数创业者信奉 "双轮驱动",同时做大模型和商业化应用,相互绑定。

核心产品接不接,一号位的选择题

据我们了解,把 DeepSeek 接入核心产品的互联网巨头,基本都是一号位做的最终决策。此前他们基本都只用自研大模型。

一位知情人士说,腾讯最高管理层与 DeepSeek 梁文锋近期见过。在大公司中,腾讯目前对 DeepSeek 的接入范围最广。除元宝、微信外,腾讯接入 DeepSeek 的产品还有腾讯文档、QQ 浏览器、QQ 音乐等,到现在已有至少 14 个。

多位百度人士告诉我们,百度要在搜索场景中用 R1、要在 4 月 1 日将文心一言免费、6 月 30 日把模型开源等一改常态的决策,是 CEO 李彦宏最终拍板。

与此同时,对增加新功能新技术远比微信更积极的字节至今没有在主力个人 AI 产品豆包上接入 DeepSeek。

字节 1 月发布大模型豆包 Pro 1.5 时,在官方技术博客中写道,字节用推荐、搜索和广告领域积累的 AB Test 经验,开发了基于用户反馈的模型训练流程,可以 "通过用户数据飞轮持续提升模型的实际使用体验"。字节认为用户与自身模型迭代之间有正反馈。

关于产品和应用是否应该分开,巨头有不同的看法,这可以从它们的组织结构看出来。

腾讯和阿里近期都拆开了原本放在一起的大模型研发团队与应用开发团队。去年底,阿里把通义应用从阿里云转到智能信息事业群,由该事业群总裁吴嘉负责,模型研发留在阿里云旗下的通义实验室。1 月中旬,腾讯将大模型应用元宝从研发大模型的事业群 TPG 转到 CSIG,交给腾讯会议的负责人吴祖榕。大模型研发团队混元仍然留在 TPG。

而在字节,模型研发和产品的组织依然紧密--字节 AI Flow 大部门下,有做豆包等 AI 产品的 Flow,也有做模型的 Seed,还有做工程优化的 Stone。

创业阵营中,MiniMax 创始人闫俊杰今年 1 月中旬曾告诉我们,过去 AI 行业的一个误区就是,"认为用户越多,模型能力提升越快",其实二者没有直接关系,应该把模型和技术分开看:"技术就是要不断提升上限;而产品的目的不是让模型变好,它就是一个商业化产品,真正需要思考的是怎么更好满足用户。"

MiniMax 在其 MiniMax Chat 产品和 to B 的开放平台上都已接入了 DeepSeek 模型。

"新一代模型不在牌桌上,基于上一代模型的产品也没意义。"MiniMax、Liblib.ai 等 AI 公司的早期投资人,明势资本合伙人夏令的观察是,AI 产品和模型当前是 "松耦合",如果决定继续追基座模型和推理模型,就不要被产品制约,从商业化考虑,该接别人的模型就接,"短中期看,产品本身不是模型和公司的关键胜负手了"。