为什么说机器人的“手”超难做?聊聊灵巧手的硬件与算法(10)

2025-12-25 17:10  钛媒体APP

泓君:特斯拉是哪种方案?

陶一伟:特斯拉是单向拉绳的方案。然后就说到单向拉绳,这也是一个主流的方案。单向拉绳好处就是说,对于腱绳材料的蠕变它不是那么的敏感,它可以通过算法的方式相对容易地去克服这个事情。但它的缺点就是说它的伸直运动是没有主动的力,相当于是靠弹簧去实现伸直。这个弹簧伸直的过程中,一是这个力相对来说还是比较小的,如果你想要尽量去优化你的抓握力的话,因为你在抓握过程中实际上是跟你的弹簧力一个对抗,你有更强的伸展力,你就浪费掉你的抓握力。但是有的时候人在一些精细的操作,人用手的过程中,反向地推这样的力,的确也会有它的作用,但是现在这个阶段我们还是在解决抓握的事情。

泓君:就没有想到张开的事情,是吧?

陶一伟:对,张开的的确还用得并不是那么多。反向推,你可以想象你如果去闭着眼睛在你的书包里掏一些东西,你可能需要把其他东西拨开。这个的确是需要一个推的动作,但是更多的还是要整手的触觉,这个确实是非常难的一个问题了,现在大家都没有去考虑这个事情。

泓君:对,那业界现在大家在向哪几个方向收敛呢?

陶一伟:从我看来,硬件上业界现在主要是朝着直驱和单向拉绳这个方向去收敛,包括特斯拉还有我们都是这样的一个方式。直驱的话也是非常惊艳的,连杆的手可能相对高自由度的做的公司会少一些。

泓君:Figure AI他们用的是什么方案?还有Physical Intelligence。

陶一伟:Figure AI,我简单看了一下他们的专利,它可能是一个六自由度的,或许是连杆,或者是其他的一些方案的一个手。

图片来源:Figure

泓君:浩之有什么补充的?讲讲你作为使用者的体验。

齐浩之:我自己是用过连杆和直驱电机的这两种,我确实没有用过绳驱动的手。

我们现在去做"机器人+AI",大概有两种比较主流的方式。第一种方式就是先用遥操作采数据,然后去训练一个神经网络去完成某些任务。在这种情况下,比较经典的代表可能是Aloha,还有像Physical Intelligence的这条路径。

另外一条比较主流的路径是在一个物理的模拟器中,去用强化学习去训练这么一个网络,就直接把这个网络从仿真器里面迁移到真实世界。比较成功的案例就是基本上所有大家看到的四足机器人、双足机器人跳舞、走路都是走的这条技术方案。

灵巧手的话,任何一种方案在现在这个时间点都有它的缺陷。但是其中的这套从仿真器中训练一个网络,再迁移到真实世界也是非常流行的。所以这个就有一个问题,就是我们在选择灵巧手的时候会去衡量它有多容易被仿真。之前我们比如说比较连杆的手以及直驱的手,我们会觉得直驱的手相比于连杆的手,会容易仿真很多,所以在我们做一些需要高自由度,需要一些用强化学习才能学到的这种灵巧操作的时候,就会选择用直驱的这个手。在之前这种直驱的手,就像刚才Evan说的,它最大的缺陷是当时的电机非常大,也是在最近几年这个电机才做得越来越小,比如说Sharpa。