为什么说机器人的“手”超难做?聊聊灵巧手的硬件与算法(14)

2025-12-25 17:10  钛媒体APP

泓君:我觉得挺有意思的,而且我注意到之前1X它还发了一个机器人Neo,这个Neo它是可以进家庭,可以帮你做一些基础的家务的,但是很可怕的是大家是以出卖隐私的方式去让这个机器人工作的,因为每个机器人后面有一个遥操的人在控制这个机器人。那我理解,其实这也是他们自己收集数据的一种方式。

Neo演示广告片 图片来源:1X

齐浩之:对,没错,就是我的理解是现在还没有一家公司能够把机器人卖到用户的家里,完成他们想要做的任务。所以1X相当于是一种有点像特斯拉在自动驾驶上面的策略,先把车卖给用户,用户去开这个车,开这个车的同时就采集到了数据。只不过是人形机器人的话,用户自己并不能操作这个人形机器人,所以就有一个他们自己的操作员去操作这个机器人。当然他涉及到的一些隐私问题、一些道德层面上的问题,其实都是需要更多地被讨论。

泓君:你刚刚提到,你2021年~2022年开始去做机器人的这些部分的,那个时候其实GPT3已经出来了,但是能不能用端到端的方式去训练机器人跟灵巧手,我觉得在那个时候它还不是市场的一个主流方向,那时候大家研究机器人的一些主要的方向在哪里呢?

齐浩之:我会认为那个时候大家研究的机器人主要是想让机器人在某一个任务上,在有限的泛化性的要求下去完成这个任务。因为那个时候硬件也不是很多,能做灵巧手科研的课题组也不是很多,灵巧手这个问题本身大家也没有很想做。特斯拉宣布做人形机器人之后,整个人形机器人行业和这个灵巧手行业迎来了一波爆发,大家才逐渐开始做这个方面。

然后在后来最近的几年,就有越来越多的人试图用GPT的研究方式去做一些端到端的模型,包括在一些比较简单的机器人本体上也做得还行,就是也有了一些初步的验证结果,比如说Physical Intelligence,他们就用很大规模的数据加上遥操作去展示了这个机器人有很强的能力。但是对于灵巧手的话,有一个更难的地方,就是灵巧手采集数据会比其他机器人采集数据要难很多。

图片来源:TetherIA

泓君:你是说手部的数据?

齐浩之:对。所以即使我们有操作员不停地一直在采集数据,距离到GPT那个等级的数据,或者说Physical Intelligence那个等级的数据还不是一个非常简单的任务。

泓君:我上次其实有跟他们的研究员聊,他们π0.5好像是说1万多个小时的数据,对吧?就1万多个小时已经算整个机器人行业最大的真实数据集,当然这个是高质量的数据。

齐浩之:对,肯定有很多公司在收集数据的过程中,他们所产生的数据远超1万个小时。但是还有一个问题就是在于什么样的数据,对于训练机器人来说是有用的。