因为开可乐仔细去分析这个事情,它实际上是一个用左手或者右手把可乐从桌面上拿起来,调整好罐口方向,再用另外一只手从空气中对准之后,以一个合适的角度卡入拉环,并且以一个合适的角度和力去打开这个可乐。并且在这个过程中,因为它是双手对一个物体进行同时操作,你的另外一只手要对抗这个拉可乐的力,对抗的过程中你又要怎么保证你的手指不会产生过大的力把这个易拉罐给捏爆?从整体机器人控制系统上来说,这是比收纳碗碟难得非常多的一件事情。

图片来源:TetherIA
泓君:所以大家觉得,现在如果我们综合来说整个灵巧手它的瓶颈是在哪?它是整个机器人行业的问题,就比如说我们还是说这个模型的问题、泛化性的问题,还是说灵巧手它除了这个之外,它还是有很多它自己这个行业独有的难题?
陶一伟:灵巧手我们不能光看它是硬件的一个模块,它能产生它的价值肯定是要配上至少一个双臂的这么一个系统。这个双臂的系统会形成一个最小可以用来工作的机器人。但是当我们想要真正让它泛化地去在一个环境里执行任务,你就会需要一个移动的底盘、移动的平台。有了这样移动的平台,大家就会说轮式的是不是可以针对一些可能更复杂的路面情况,包括机器人的上下的运动?大家又会说,那可能还真的是一个全人形的更合适。所以说真正能让灵巧手有价值,肯定不是简简单单一个硬件模块可以去解决的事情。
齐浩之:它的难点肯定是整个机器人到处都是难点。经常也会有人问我做灵巧手最难的地方是什么?我认为现在来看,硬件和软件还会有一个很大的提升空间。
从软件层面来说,我的理解是一些比较成熟的在机械臂或者一些轮式机器人上面的算法,就是一些机器学习的算法,当把它们直接应用在灵巧手或者人形机器人这种更复杂系统的时候,它会出现一些之前没有预料到的问题。比如说现在的灵巧手可能有四五个手指,然后每一个手指有各种各样的关节,每一个关节都可能与这个环境发生交互、与这个物体发生交互。那么怎么能在保证这些交互所产生的一些影响是对我们有利的?比如说我们今天想要抓一个物体,如果我们用一个夹爪去抓,我们只需要考虑两个接触点该怎么去触碰这个物体?但是如果我们现在给了10个接触点,那么这10个接触点该怎么去分别地接触这个物体?有的接触点之间可能是互相对抗的作用,这种情况下在计算复杂度上就会显著地变难。
从硬件层面来说,我开始研究灵巧手可能是2021年、2022年,在那个时候是只有非常少的选择,我们可以买到并且还可以用的灵巧手。在最近的一两年,我们的灵巧手硬件,尤其是国内厂商,还有美国这边一些造硬件的公司都有了长足的进步,所以我觉得这方面的瓶颈在逐渐地减少。但是我的预测是还需要几轮的迭代,才能做到一个比如说大家现在能看到的宇树机器人那样,一个逐渐收敛的构型。
泓君:现在的灵巧手,市面上能买到的,大家的形状、硬件都各不一样,那你就要去根据这个硬件调配自己的软件。
齐浩之:嗯,就是以像人的灵巧手居多。但是每一家公司他们的技术路线都会有所不同,像陶总的公司应该是绳驱的技术方案,也有一些公司是把电机放在灵巧手的手指上这种驱动方案。










