资本市场对于人形机器人的炒作颇有过去元宇宙时期的风采。

但是实际上目前大部分的人形机器人的开发其实都是一种炒作,现在市面上的人机器人其实还都处于起步阶段,即使是已经开始贩卖的那些公司,实际上卖出去的也只是用于教学和简单的搬运工作,远远达不到真正的通用。

而公众想要的,其实是能够进场完全替代其工作或者可以放在家里做家务的机器人,这至少需要再过10年才能看到曙光。然而对于公众来说,他们甚至分不清双足和四足机器人是两类机器人。

对于面向工厂的机器人,目前开发最顺利的是来自Boston Dynamics的Atlas和Agility Robotics的Digit,而家用方向则是以tesla的擎天柱机器人为代表(尽管他们声称在工厂中也可以使用,但是目前来看主要是想使用在家庭中),另有一众初创公司正在开发。

而从技术的角度来讲,Atlas拥有最先进的全身控制系统,可以搬运20kg以上的不规则重物。即使如此,他也只是刚刚开始准备在工厂中试点部署。

而其他的双足机器人的控制系统依旧处于较为初级的阶段。大部分的双足机器人做成的那些惊艳的动作,其实都是通过强化学习过拟合上去的,是真正的one-trick-pony。这些机器人在真实场景下的泛化性能十分的堪忧。

之所以有这么多的公司开始投入人形机器人,是因为大模型(VLA)的出现,这些公司盲目的觉得现在的算力已经足够,到了可以使用强化学习+LLM来解决一切的时候了。但是事实真是如此吗?

尽管强化学习是一个非常有前景的领域,但是由强化学习到的控制策略往往难以泛化到更广泛的情景。虽然宇树在4足机器人上使用强化学习已经取得了卓绝的成果,但是这仅限于四足了。双足机器人的动作空间要远远大于四足,使用强化学习来学习一个能泛化的控制器是极其困难的。尤其是我们还需要双足机器人去做多种多样的操作与格式各样的环境进行互动,这需要机器人具备操作和感知的能力,但是这不是依靠模仿人类动作和强化学习模拟可以解决的问题。

而LLM在更多的时候,也仅仅是能给机器人提供有限的理解环境的能力,难以指挥机器人执行长时间的工作。

我觉得有一件句话说的很好“尔曹身与名俱灭,不费江河万古流”。即使是现在这个公众对于机器人认知极度走偏的年代,还是会有无数伟大的工程师继续在机器人以及控制的领域深耕。而对于我们,唯一能做的,就是等待这些人真正改变世界的那一天。但是我可以确信,这一天不会来的很快,我们还有很长一段路走。