为什么说机器人的“手”超难做?聊聊灵巧手的硬件与算法(13)

2025-12-25 17:10  钛媒体APP

泓君:不是在手掌内,是在小臂上。

陶一伟:其实是都有,所以说这也是我们自己方案和特斯拉有一些差异的点。它的小臂控制更多的是一个大的抓握力的肌肉,你可以这样理解,因为它的肌肉还是比较大的。手掌内分布的肌肉更多的是控制手的一个灵巧的精细化的操作运动。

齐浩之:我有一个比较好奇的问题,刚才二位也提到了装配一个绳驱的灵巧手可能要花的时间非常多,而且要非常专业的人去做。我比较好奇的是,这会不会使它的产能相比直驱的灵巧手有一个比较大的区别?

陶一伟:是的,我认为是这样的,直驱灵巧手因为作为可能更像传统意义上的机械结构,包括机器人系统,它通过传统的一些比较成熟的机械的工艺的方式,可以实现比较容易的装配,你可以通过拧螺丝或者是焊接的这种方式去组装,这样的方式都是已经比较成熟的方式,它既能保证精度,也可以保证整个效率。

但是绳驱,因为腱绳的方案,传统意义上这方面的整合的事情就做得不是那么多,所以说这方面是需要整个行业去推进的一个事情,包括腱绳怎么两端固定的驱动器和末端的执行元件的连接,既能保证它生产速度,同时保证它的精度,这个事情大家还是在探索的过程中。但是这个事情最终还是一个工程的问题,它并不是一个基础的科学问题。所以说随着整个行业的推进,我们认为这个事情最终是能被克服的。

04 揭秘灵巧手"数据金字塔"

泓君:我们刚刚聊了很多跟灵巧手的硬件相关的问题,那接下来我们可以聊一聊算法层面的,就是浩之你这边主要在研究的。

齐浩之:在过去的几个月里面,我主要研究的是如何从一些人类的视频中学习这些灵巧操作的技能。

现在大家可能比较了解的是应用一些遥操作的方式。遥操作就是现在我们有一个操作员,他可以戴一些动作捕捉的手套或者一些动作捕捉的衣服,然后把这些人的动作映射到机器人的手上。但是这样其实可能有一些缺陷,第一个缺陷就是说每一个操作员都要适配一台机器人,那么如果我们想要把机器手操作的数据一直把它推广到像有语言数据那么多,是非常困难的,因为没有那么多机器人以及产能不够。

所以另外一条路就是说我们能不能根据一些现有的数据,比如说有很多视频是包括人去录制自己如何做饭、如何去清理家务,有一些手的动作,我们就想要研究能不能通过让机器人观看这些手的动作,然后让它自己就学会了这些技能。

泓君:现在表现怎么样?

齐浩之:现在我会把它归类为还在研究的阶段。如果我们的目标是想要达到一个最好的效果,那么肯定是直接用遥操作的方式去采集机器人本身的数据会是最好的。但是因为现在我们还没有把从人类视频中学习数据的这个样本数目推广到足够多。我相信从长远来看,这条路径很有可能会取代遥操作。