本文提出了 Minimalist Compliance Control(极简顺从控制),这是一种无需力/力矩传感器、无需复杂学习过程的机器人顺从行为实现方案。该方法仅通过电机电流或 PWM 信号估算外部扳手(Wrench),并结合任务空间导纳控制,在机械臂、灵巧手和人形机器人等多种形态上实现了高性价比的触碰敏感交互。
TL;DR
斯坦福大学研究团队提出了一种名为 Minimalist Compliance Control (极简顺从控制) 的架构。它不需要 6 轴力/力矩传感器,不依赖昂贵的触觉皮肤,甚至不需要复杂的强化学习训练。它仅仅通过读取电机自带的 电流 或 PWM 信号,利用物理模型精准反推外部受力,即可让机器人实现绘图、擦拭、蛋上运物等高精度接触任务。
核心定位:该工作是经典的控制理论在现代低成本硬件上的回归与升华,它证明了“模型驱动”在鲁棒性和泛化性上依然能击败许多“数据驱动”的黑盒方法。
痛点深挖:为什么“顺从”这么难?
在机器人与环境发生物理接触(如推门、写字、抓取易碎物)时,如果控制器是刚性的(Position Control),微小的感知误差就会导致巨大的撞击力,轻则任务失败,重则损毁机器。
目前的解决方案主要有两条路径,但各有短板:
- 硬件派:安装 ATI 等昂贵的六轴力传感器。缺点是贵(通常比机械臂还贵)、易损坏、增加布线复杂度。
- 学习派 (RL):通过强化学习模拟顺从行为。缺点是 Sim-to-Real 鸿沟 巨大,模型在模拟器里跑得好,回现实世界可能因为电流噪声或摩擦力不匹配而疯狂抖动或产生危险的力峰值。
方法论详解:物理直觉的胜利
Minimalist Compliance Control 回归了物理本质:电机的电流与产出的扭矩成正比。
1. 从 PWM 到力的“点石成金”
即使是没有电流传感器的廉价舵机,也可以通过 PWM 占空比、母线电压和反电动势(Back-EMF)模型推算出绕组电流 $I_w$: $$V_{\mathrm{PWM}} = \mathrm{PWM} imes V_{\mathrm{bus}}, \quad I_{\mathrm{w}} = \frac{V_{\mathrm{PWM}} - V_{\mathrm{emf}}}{R_{\mathrm{w}}}$$
作者进一步考虑了传动系统的 效率非对称性:电机推负载(正向)和负载压电机(反向/Back-drive)时的效率是不一样的。通过校准这两个方向的效率 $\eta$,系统能更准地从扭矩中剥离出“外部干扰力”。
图 1:系统架构。从电机信号估算 $\hat{\mathbf{f}}_{\mathrm{ext}}$,驱动虚拟弹簧-质量-阻尼器模型更新位置参考值。
2. 任务空间导纳控制
得到估算的外部力 $\mathbf{f}{\mathrm{ext}}$ 后,系统将其注入一个虚拟的动力学方程: $$m \ddot{\mathbf{x}} = \mathbf{K}p (\mathbf{x}{\mathrm{des}} - \mathbf{x}) + \mathbf{K}d (\dot{\mathbf{x}}{\mathrm{des}} - \dot{\mathbf{x}}) + \mathbf{f}{\mathrm{cmd}} + \mathbf{f}{\mathrm{ext}}$$ 这让机器人的末端看起来像是一个挂在弹簧上的阻尼质点。当它碰到障碍物时,$\mathbf{f}{\mathrm{ext}}$ 会抵消掉部分向前的指令,使机器人自动“缩回来”或者“贴着走”。
实验与结果:全能选手的表现
作者在四种完全不同的机器人平台上验证了该方法,展示了极强的 Embodiment-Agnostic(形态无关性)。
1. 人形机器人的柔性交互
在 ToddlerBot 人形机器人上,该方法配合 Vision-Language Model (VLM) 实现了复杂的黑板绘画。即便 VLM 给出的深度信息不准,机器人也能靠导纳控制“贴合”黑板面,而不会撞坏笔头。
图 3:力估算精度对比。虚线(估算力)与实线(昂贵传感器测量值)高度重合,平均误差仅约 1N。
2. 性能倍杀 RL 基线
在与 UniFP 和 FACET 等最先进的强化学习控制方法对比中,本文的方法展现了更好的稳定性。RL 方法往往在接触瞬间产生力突变,而 Minimalist 方法的力响应非常线性且平滑。
图 5:ToddlerBot 在绘画、擦拭和球体旋转任务中的表现,成功率远超纯位置控制。
深度洞察与总结
为什么这篇论文很重要?
- 即插即用 (Plug-and-Play):它证明了顺从控制可以作为一个底层的“透明层”,上层逻辑不管是 VLM 分解的任务还是扩散策略(Diffusion Policy)生成的动作,都可以直接套用。
- 硬件民主化:它极大地降低了触觉研究的门槛。对于大量使用 Unitree G1 或 Dynamixel 舵机的研究者来说,不需要买传感器也能做接触式复杂任务。
局限性
- 高静摩擦/死区限制:对于那些使用了超高减速比且不可反向驱动(Non-backdrivable)的电机,电流信号很难反映末端受力,该方法会失效。
- 准静态假设:目前忽略了关节加速度和科里奥利力,在进行高动态剧烈运动时,力估算的精度会有所下降。
总结:Minimalist Compliance Control 是一篇诚意十足的工程与理论结合之作。它提醒我们,在狂热追求大模型和端到端学习的同时,深入挖掘硬件潜力和物理模型,往往能提供更加优雅、可靠且低成本的解决方案。
