近日,字节跳动旗下豆包模型的核心技术负责人乔某,因私生活传闻引起社交媒体的广泛关注。今天上午,有媒体指出乔某及另一位涉事同事的飞书账号状态显示暂停使用,意味着公司内部或已启动调查。
值得注意的是,近期字节大模型团队刚刚经历了组织结构上的重大调整,乔某事件可能会成为新的不稳定因素。而在推理模型竞争日趋白热化的当下,团队稳定性或许也会引发外界对于业务层面的担忧。
3月18日,字节跳动豆包大模型部门(Seed)召开全员会,新近加入的吴永辉与原负责人朱文佳共同主持。有接近字节的消息指出,吴永辉目前已经接手AI基础研究探索工作,而朱文佳主要负责模型应用相关工作,两人都向字节CEO梁汝波汇报。
朱文佳此前是豆包大模型的核心人物,有深厚的技术背景,早期在百度任搜索部主任架构师,加入字节后曾任字节跳动CEO、TikTok产品技术负责人。2023年字节成立的首个大模型研发的团队,就由朱文佳主导。
相较于其它大模型公司,字节入局时间较晚,但2023年后为此投入了巨大资源,而豆包大模型也不负重望,在2024年成为国内用户下载量最大的大模型APP,并赢得了优秀的用户口碑。就此来看,朱文佳的成绩可谓两眼。
资料显示,乔某此前就属于朱文佳的团队,是语言模型的负责人,也就是豆包大模型的核心技术骨干之一。
但是今年2月,原谷歌DeepMind副总裁吴永辉加入字节负责基础研究后,观察者网了解到,多位原朱文佳的下属已经转向吴永辉汇报,乔某也是其中之一。
相比于搜索出身的朱文佳,吴永辉的履历更集中于AI领域,是谷歌大模型Gemini的核心贡献者之一,无疑让人对字节大模型有了更高期待。
从整个行业来看,字节的补强也恰逢其时。2025年基础大模型的竞争正在进一步向头部集中,曾经的"大模型六小虎"人事变动频繁,部分企业已经逐渐弱化基础研究,转向应用落地。
零一万物CEO李开复近日接受彭博社专访时曾表示,中美两国超大模型的预训练都在逐渐寡头化,中国大模型会收敛至DeepSeek、阿里巴巴、字节跳动三家。
DeepSeek自年初出圈以来,已经在用户口碑上建立了巨大优势,而阿里通义大模型近期也在诸多测评中获得了与DeepSeek不相上下的成绩。
在这两大开源模型的竞争下,目前仍以闭源为主的字节大模型需要拿出更强大的模型能力,来保持自己第一梯队的位置。
而多位业内人士都曾向观察者网谈到,大模型的竞争很大程度上是人才的竞争,谁能聚集行业内最优秀的天才,谁才能拥有成功的基础。此前一些大模型企业的内部人员纠纷,都曾引起业界广泛关注。
此外,豆包今天下午宣布,新版深度思考功能开启测试。和之前的深度思考不同,新版功能将推理过程的思维链与搜索深度结合,支持边想边搜。
侧重深度思考能力的推理模型,已经成为当下确定性最强的发展趋势,DeepSeek R1、OpenAI o3等推理模型都展现出显著优势。但字节豆包在推理模型的进展上相对低调。
上月有消息称,豆包正在小范围测试基于豆包 1.5基座模型研发的深度思考模型。