为什么说机器人的“手”超难做?聊聊灵巧手的硬件与算法(4)

2025-12-25 17:10  钛媒体APP

就正如陶总所说,如果我们只优化这一个视频,那有一些头部的硬件厂商或者算法的研究院,他们可以做出来。但是从长远的角度来看,我们更应该专注的是什么样灵巧手的构型是能够适用于最多种类的任务,以及对于算法的接口最好。

图片来源:Figure

泓君:所以现在,浩之,根据你的研究,你觉得已经有公司它能做到我随意摆上去--我们不说任何环境、任何场景--我们就说这个可乐罐,它的瓶跟它的开口,不一定是正对着这个机器人的手的,它能把它打开的这样的一些公司吗?

齐浩之:我觉得现在是没有这样的公司的。如果一个公司他们今天想要完成这个任务,他们可能会从技术上花几个月去做到这件事情,但是他们可能需要花费非常多的资源和非常多的时间,可能就是出于对他们本身公司路线的考量,他们不会去做这件事情本身,而更倾向做一些算法上的改进,让他能够缩短以后想要做这件事情的时间。

泓君:就是他们不会针对单个的任务去做这种优化,而是他是希望现在在优化的方向是让他适应尽可能多的任务,就是还是更加看重它的泛化性。

齐浩之:是的。

泓君:了解。如果照这个来说的话,我印象中之前Figure AI他们放了一些视频出来,大概就是有机器人它能把盘子放进洗碗机里。所以这个视频它可能是拍很多次失败挑出来的一些成功的案例?还是像你说的,它其实是通过遥操,它只是一个展示类的视频,它并不代表机器人拥有这样的一些能力?

齐浩之:我觉得这里面没有一个确定的信息源吧。但是我觉得就是现有的算法是可以做到在一个固定的场景下能比较容易地拍出这种视频,比如说它整个任务的成功率可能有80%-90%,在这种情况下拍一个视频,也是自主完成的,它的难度也没有特别高。但是距离让这种人形机器人走入千家万户,它可能差的是如何在每一个场景下都可以以100%的成功率去完成这些任务。比如说把盘子放到洗碗机里,很可能90%也是不够的,因为有10个盘子,如果碎了一个,大家就不想用这个机器人了。所以可能需要改进的就是成功率,以及老生常谈的泛化性的问题。

泓君:所以现在在灵巧手的问题上,大家关注的也还是泛化性。

陶一伟:对,我这里也补充一下,实际上我们在每一个任务中还是要去细分地看它整体的难度。因为刚才泓君您提到装洗碗碟和从洗碗机里往外拿,这个任务拆解下来,它主要是机器人拿起碗碟,打开洗碗机的门,然后放进洗碗机的架,这几个就像齐老师说的,做简单的抓取物体,并且拉动一些拉杆,属于相对比较简单的任务。这个难度实际上跟刚才我们谈到的开可乐还不是一个数量级。