嘉宾们认为,对灵巧手头部公司来说,短期内针对单项任务打造成功一个的Demo并不难,真正的突破在于通用性与可扩展性。当算法能让机器人在短时间内学会开可乐、开门、拧螺丝等多样化的灵巧操作,才意味着灵巧手到达了类似ChatGPT的泛化突破阶段。

以下是这次对话内容的精选:
01 机器人灵巧手的能力与挑战
泓君:可能听众最迷惑,在很多Demo里,大家看到机器人可以去拿吸尘器、倒垃圾、烧水,甚至把盘子放在洗碗机里。我记得特斯拉有一年的发布会,擎天柱现场给大家倒酒,看起来这个手已经是很智能了。所以可不可以概括一下,现在机器人的手它能做哪些场景?它到了一个什么样的发展程度?
齐浩之:好的,我会认为,在遥操作的情况下,如果这个手的手指不需要很精细的动作,那它是一个比较简单的问题,比如说擎天柱倒酒,它就是把手放到出酒的那个把手上,往下压,这个在控制上是比较简单的。
与此相对的是,比如说今天我们想让一个机器人使用我们家庭里面的各种工具,比如说像螺丝刀、像剪刀这样的东西,在这个过程中我们的手指需要更加精细灵巧的操作,在这种情况下它的操作就会变得很难。以及我们需要它适应于千家万户不同的工具,这个难度就会呈指数级的上升。

"擎天柱"(Optimus)展示倒酒 图片来源:X
泓君:你刚刚提到了一个词是"精细运动",还有一个我理解就是讲它的"泛化能力",就是把它放在不同的场景中,在这两块是还需要加强的。
陶一伟:我稍微补充一点,刚才齐老师可能是从系统端的角度来讲这个问题,我可能更多地是从硬件这方面去切入。一是把现有的硬件方案做得更可靠,就是说让机器人能够在真实的环境中不停地长时间稳定的运行,并且和自然物体的交互,在长时间使用中不会损坏,这个事情实际上也没有完全地去做到。
并且这个硬件还是需要继续地去迭代,比如增加它的自由度,增加它的触觉传感。在这个过程中,由于系统复杂性的增加,它的可靠性又变成了更大的挑战。这也是从硬件端还需要我们去做的很多工作。










