
搭载COSA的全尺寸人形机器人Oli完成移动操作,把两瓶水递给客人
Q:对于具身智能行业来说,COSA这种Agentic OS意义是什么?
A:26年行业会从关注单个模型能力,到关注具身Agentic系统能力,这是一个从技术demo为主导转变为以产品体验为主导的关键一步,我们率先迈出了这一步。我认为未来的操作系统(包括手机、计算机)都会升级为agentic的,而人形的OS一定必须是Agentic原生的。COSA就是为人形机器人设计的Agentic OS。
Q:做好COCA需要什么技术栈,有什么壁垒?
A:小脑基础模型,记住是"基础模型",不是一个一个policy。不能是一个一个预先编好的动作舞蹈,而是要做到实时生成任意全身动作,这是整个系统的基石。
大小脑融合的高阶技能层,打通导航、避障、移动操作、上下楼梯等复杂行为和全身运控基础模型间的对齐,真正让大脑能力触达物理世界,这是运动智能与认知智能之间的桥梁。
具身智能体技术,以Agent原生理念来设计、调度、融合、管理所有模型、技能、工具、记忆、人格、情感等,实现自主思考能力。
Q:你提到的"小脑基础模型"和"大小脑融合"指的是什么技术?
A:所谓小脑基础模型,是一种能够实时生成运动指令的模型。现在行业里常见的运动控制,比如跳舞、翻跟头,通常都是靠预编程或预先训练好的策略,就像一个死记硬背台词的演员,一旦中间被打断,整个动作就会失败。而小脑基础模型不同,它是实时的运动生成系统,你可以随时指挥它做任何动作,即使是它从未"学"过的,机器人也能执行。










