造出一双好用的灵巧手,不比直接造机器人简单。机器人吃过的苦它一样不落,还要在更小的尺度里做到极致。

作为人形机器人中的核心零部件,灵巧手指的是模仿人手运动机理设计的末端执行器。相比较夹爪,灵巧手的通用性更强,可以实现拧螺丝、抓取不规则物体等精细操作。通过使用灵巧手,机器人也可以使用人类生活中的各种工具。

不过根据 2025 年的相关统计,全球人形机器人本体企业和灵巧手企业在数量和估值上有着明显的差异。新战略人形机器人产业研究所数据指出,截至今年 4 月,全球人形机器人本体企业数量已超 300 家。M2 觅途咨询数据显示,截至今年 7 月,全球灵巧手企业已经有 122 家。

在估值方面,此前完成 C 轮融资的人形机器人企业 Figure 的投后估值已经达到了 390 亿美元(约合人民币 2,700 亿元),国内的宇树科技在 6 月完成 C 轮融资之后估值则是超过了 120 亿元。而灵巧手头部厂商灵心巧手的估值是超过 20 亿元,其他部分企业的估值也多在 15 亿元左右。

目前来说,虽然灵巧手企业的数量和估值相对人形机器人来说偏低,但作为机器人身上的关键硬件,灵巧手能够发挥出的作用是不可估量的。

清华大学计算机系教授孙富春就曾指出:机器人是自动化的「最后一公里」,而灵巧手则是机器人的「最后一厘米」。

不过要想真正造出一双稳定、好用的灵巧手是很难的事情,成本、性能和可靠性的「不可能三角」也是困扰整个行业已久的问题。

在这方面马斯克也非常头疼,他曾透露 Optimus 灵巧手的工程量可能会占到整机开发工程的一半。在过去的 ALL-IN 峰会上,马斯克是这么说的:「如果你想让机器人真正能够完成所有人类能做的事,就必须先解决灵巧手的问题。」

具体来看,要让灵巧手的自由度和精度到位,研发就需要在驱动、传感和传动结构等方面下功夫。而在手内狭小的空间里要集成电机、传动和传感,就很难做到手部重量、散热和功率密度之间的完美平衡。

并且手部每增加一个自由度,控制复杂度和可靠性方面的困难都呈指数级上升,所以目前的灵巧手很难同时满足高性能、够可靠和低成本。

不过作为通用人形机器人的关键硬件,灵巧手还是目前本体价值最高的零部件之一,通常价值量要占到本体的 20% 左右。

这也就意味着,灵巧手是显著影响整机成本结构和商业化节奏的重要硬件,其技术与供应链成熟度,也是决定人形机器人能不能从走向「好用实用」的一大瓶颈。

而且随着人形机器人大规模量产节奏的变化,灵巧手也将会充分受益。高工机器人产业研究所(GGII)此前预测,到 2030 年全球人形机器人市场销量将接近 34 万台,市场规模将超过 640 亿元;到 2035 年,全球人形机器人市场销量将超过 500 万台,市场规模将超过 4,000 亿元。

如果超半数的人形机器人都选择配置灵巧手,那么灵巧手的市场空间就可想而知了。在未来的巨大市场空间下,现阶段灵巧手厂商之间的竞争,就是要拼技术上的突破,谁能做好产品成本、性能和可靠性的平衡,谁就有机会分到更大的蛋糕。不过这一切说实话并没有想象中的简单,造出真正好用的灵巧手依然任重道远。

技术路径尚未定型

其实灵巧手和机器人一样,并不是近几年才有的产品。是因为具身技术的快速发展,才让它们能够更多地走到大家视线当中。

早在上世纪 70 年代,日本电工实验室就推出了 Okada 三指灵巧手,拥有 11 个自由度的同时采用了类似人手的关节布局和腱绳传动系统。

此后在 80 年代斯坦福推出的 JPL 三指 9 自由度灵巧手,采用 12 个直流伺服电机和腱驱动系统,这也一定程度上为现代灵巧手的传动系统奠定了基础。

不过早期的灵巧手自由度是偏低的,而且也是三指为主,甚至成本也偏高,不具备量产的基础。

到了 00 年代,英国 Shadow Robot 的 Shadow Hand 将自由度提高到了 24 个,并且五指灵巧手的技术也偏向成熟,可以完成拧瓶盖等复杂的操作,实现了小批量的量产。

此后在 10 年代,灵巧手的智能属性出现了进一步提升,比较有代表性的就是 OpenAI Dactyl,通过强化学习可以自主复原魔方。从这里开始,灵巧手就已经有了现代产品灵活且智能的雏形了。

而到了 2022 - 2023年,特斯拉 Optimus 的灵巧手也 11 自由度迭代到了 22 自由度,并且采用行星齿轮 + 丝杠 + 腱绳的结构,可以实现网球抛接等复杂动作。

此后这几年随着技术的演进,灵巧手的技术也开始逐渐走向成熟,形成了一些比较稳定的方案。驱动、传动、传感加控制,它们之间的协同也是灵巧手在精度、感知等性能上的关键。

作为灵巧手的动力来源,目前驱动有电机驱动、液压驱动和气压驱动等多种方式,而且现在灵巧手主要是采用电机驱动,包括空心杯电机等。传动则是传递动力的方式,有腱绳传动、连杆传动、蜗轮蜗杆传动等方案。而传感和控制主要是决策执行中的步骤。

在这中间,传动是行业内技术路线选择比较多样的环节,其中腱绳传动有重量轻、空间灵活,易做多自由度等优点,但最大的痛点就是容易磨损,而且维护起来比较复杂。

而连杆传动优点是刚度高、承载大、传动效率稳定,不过对空间与装配非常敏感。蜗轮蜗杆传动响应快、定位精度高,但体积和重量很大。

不过业内也在尝试复合驱动,就是利用腱绳、齿轮等进行排列组合,来挑选出相对优秀的解法,这样可以兼顾各个方案的优点,只不过复杂程度较高,集成起来难度也很大。

总体来看,目前在传动方案上其实也没有标准答案,有的就是与任务负载和成本等方面相匹配的选择。

在具体产品上,灵心巧手的 Linker Hand L20 采用的就是连杆传动方式与自研电机驱动,可以模拟接近人手的自然抓取方式,能够实现更丰富、更精细的操作。

而伯牙智能的高山 D22Pro 灵巧手则是采用腱绳传动的方案,这一方案的好处就是能够带来更轻的指尖重量和更快的响应速度。

此外在蜗轮蜗杆技术上,陶世智能的环面包络减速器在机器人灵巧手场景中,可实现整手承载达 50 kg,运动精度 0.015 mm。

可靠性是落地关键

马斯克在公开场合多次聊到机器人灵巧手的问题,在此前的特斯拉 Q3 电话会上,他就表示要造出像人手一样灵活能干的手是不容易的,Optimus 的手和前臂就是一个非常困难的工程挑战。此前,晚点 LatePost 报道中援引的相关人士称:「Optimus 灵巧手的使用寿命不超过两个月,覆盖在手指和手掌的柔性电子皮肤会在 Optimus 摸东西时加速磨损,驱动手指的腱绳容易老化断裂。」

而这就是灵巧手不可能三角中的可靠性问题,灵巧手在实际使用过程中没有想象的那么耐用,甚至在工作中会出现发热的情况。

不单马斯克焦虑,这对于整个行业来说都是一个令人头疼的问题。

灵巧手要想搭载在机器人上更好地工作,首先要攻克大小的问题,一般情况下灵巧手都是仿照人手的大小来设计的。如果尺寸过大,它和机器人本体的协同工作效率就会打折扣,而且尺寸大就意味着灵巧手的重量也会大不少,这样的话机器人的有效作业负载也会受到影响。

但一个矛盾的问题就是高自由度的灵巧手很难做小,灵巧手内要集成上百个微型电机等零部件,让他们很好地一起工作、互不干扰的话,对零部件的小型化和高集成化要求很高。

在这个高度集成化的过程中,灵巧手内的空间就会被挤压,各种电机、传感器等零件紧紧排在一起,难免会出现集中发热的情况。但手内又没有足够的空间去装散热,所以加足够散热装置的灵巧手很难做小。

要在散热设计上下功夫的话,增加外壳厚度或者增加散热鳍片这些操作又反过来会增加灵巧手的体积,这样的话手的敏捷性等性能就会受到影响,非常难以权衡。

而且灵巧手发热的情况一般都是在进行高频高精度工作中所产生的,这些一般都是在工厂内,也就是机器人要密集替代人力的场景,发热会让手的性能下降,极端情况下甚至会停机。工业场景重复的工作会让灵巧手加速磨损老化,如果灵巧手只能用两个月,工作中甚至有停机风险,那这样的可靠性对于想要替代人力的工业场景来说显然是不够用的。

灵巧手也一样缺数据

在数据方面,灵巧手和机器人本体一样发愁,这是其他很多零部件不需要面对的问题,所以灵巧手难做并不只是说说而已。

虽然目前的机器人在视觉和决策等方面的理解能力进步飞快,但要想让他们在现实世界中拥有像人一样的灵活度还是不容易的,尤其是灵巧手的操作,比如叠衣服、稳定拿鸡蛋等对于人类来说非常简单的任务换在灵巧手身上就显得异常困难。

因为灵巧手缺乏大量交互类数据,特别是很重要的力控和与各类材质接触的数据。

但目前的灵巧手数据采集也面临着规模、真实性和泛化性的三重困境。主流的采集方式往往难以兼顾三者,遥操作的采集方案能获得高精度、高真实性的数据,但效率偏低和成本较高的问题一直存在。

依靠视频等公开数据的学习方式虽然成本低、易于扩展,但缺乏核心的力觉、本体感觉等核心信息,导致数据价值有限。

此外,仿真合成的方式可以快速生成海量数据,但仿真与现实的物理差异又让数据难以直接迁移应用,泛化能力不足。

而在真实的物理场景中,灵巧手所要面临的操作对象更加复杂,毕竟生活中很多物理的形状都是不规则的,它们的形态各异,材质和重量也有无限变量,所以仅靠实验室里难以覆盖到全部的场景。不过在一些比较垂直的场景中,比如工厂,机器人所要进行的操作就偏固定,这种情况下灵巧手在数据上的困难反倒没有那么大,更主要的问题是硬件。

但灵巧手设计的初衷就是要能够通用,毕竟现实生活中的基础设施大都是为人类形态服务的。有了灵巧手,机器人才有了在任何场景都适用的物理基础,所以灵巧手的通用数据还是必须要解决的问题。

面对这个问题,在数据体系构建方面,目前行业内也在逐步转向真实场景采集 + 仿真数据补全的混合模式,既保证数据的物理真实性,又通过仿真手段扩大数据规模、提升泛化能力。

同时通过算法创新实现数据的高效筛选与压缩,提取核心有效信息,从而降低数据存储与处理成本。

此前,灵巧智能在 10 月份开源的大规模多模态灵巧操作数据集 DexCanvas,将力觉这一关键维度引入大规模数据,使机器人能模仿人类的动作轨迹,也能理解操作中的力学。

这也是他们在一定程度上对于现有数据集难以兼顾规模、真实性与力觉信息问题的回答。

突破探索仍未停下

目前的情况就是,大家都知道灵巧手是机器人提高通用能力的关键零部件,可谁也不敢说自己真正造出了兼具成本、性能和可靠性的产品,这也是目前很多场景下我们看到机器人还在使用夹爪的原因。

可即便再难,灵巧手也依然是机器人零部件中不可或缺的一环,机器人走向大规模量产终究是要越过这个核心硬件卡点。

所以整个行业也在积极寻找平衡灵巧手不可能三角的方案,让它们能够真正成为好用可靠的产品。

在技术上,目前行业也开始越来越多地采用仿生设计 + 轻量化集成的结构方案,借鉴人类手部解剖特征优化关节分布与传动结构,在保证多自由度的同时,通过碳纤维等轻量化材料降低整体重量,解决灵巧手过重的问题。

而且在驱动方式的选择上,融合分布式电机驱动和腱绳传动技术等复合传动方案迅速登上舞台,既可以保留关节独立控制的精准性,也能够通过柔性传动提升操作的柔顺性,减少碰撞冲击的风险。

此外,通过在指尖、指腹集成触觉、力觉、位置传感器来提升操作可靠性的方案也开始变得常见,这种多模态感知融合的策略可以弥补机器人单一模态的信息缺陷,也是提升灵巧手操作可靠性的关键。

这些技术层面的持续迭代,本质上都是行业为量产铺路的主动破局。毕竟灵巧手的技术进展,也极大程度上关系到机器人的落地效率与市场竞争力。

总之不管是如何,在不少机器人厂商都给出了未来量产规划的当下,灵巧手行业也算是站在了机器人时代的分岔路口。但在追求一款真正好用的灵巧手的路上,没有人选择放弃。

作者:兰博

编辑:James

原标题:《谁在放弃灵巧手》

阅读原文