在机器人领域,一场没有统一Benchmark的竞赛正悄然上演,各家厂商在探索与实践中,不断碰撞出“非共识”的火花。
回望去年的世界机器人大会(WRC),各参展商还在比拼谁能让机器人更快地行走。而今年的大会,机器人硬件形态开始多样化,针对不同场景推出不同产品,以期吸引落地和量产机会。软件算法方面,VLA、端到端模型、仿真数据训练等技术路线层出不穷。
由于缺乏统一标准,各家的尝试天马行空,甚至彼此不兼容,核心路线上也各走各道。然而,这正是新兴行业初期的常态。非共识是推动技术探索、寻找真理的关键动力。在模仿和复现之后,行业必然会经历发散期,再缓慢收敛,循环往复。真正的答案,在一次次的发散与碰撞中逐渐显现。
对于当前机器人领域的几个关键争论点,我们采访了一些关键公司,并梳理了公开言论,发现以下几点尤为突出:
算法与数据的争议首当其冲。宇树科技创始人王兴兴认为,当前机器人行业对数据关注过多,对模型关注不足。他指出,即使拥有大量高质量数据,如果模型架构不够好、不统一,也无法真正落地。而星海图联合创始人许华哲则持相反观点,他认为数据是决定模型能力下限和基础的关键,没有数据,模型能力无法突破。
在真实数据稀缺、自采成本高的情况下,仿真数据能否替代成为另一大争论点。银河通用创始人王鹤表示,合成数据是推动产业发展的关键数据资产,占训练数据的绝大部分。而自变量创始人兼CEO王潜则认为,手部复杂操作无法通过仿真数据来进化,但导航、走路等更适合用仿真数据。
关于数据飞轮的起点,即需要多少数据、如何获取高质量数据,也存在不同看法。维他动力认为,决定涌现的关键是数据的多样性而非数量。星海图则强调,高质量的一万小时是数据飞轮的起点,但目前行业极度缺乏数据。加速进化副总裁赵维晨则指出,目前全国具身最大开源数据集规模才百万级别,不可能通过操作100万小时就训练出一个多模态的具身大脑。
在构建机器人“大脑”的路径上,端到端模型、VLA+VLM、世界模型等概念纷争不断。宇树科技王兴兴对VLA模型持怀疑态度,认为世界模型的收敛方向更快。星海图则提出分层系统是通往完全端到端的必经之路。自变量则坚持做完整端到端的统一大模型。
软件与硬件的关系也是争论的焦点。星海图认为硬件应根据AI模型的能力进行优化,而越疆机器人和加速进化则认为机器人可能会重演手机的发展路径,先由硬件厂商带动产业热度,再由“大脑”和“应用”主导行业分层。众擎机器人则指出,软件与硬件共同决定机器人的价值。
在开源的问题上,各家也有不同看法。星海图认为目前行业内存在“假开源”现象,真正的开源应开放经过验证的数据和模型权重。而自变量则指出,由于具身模型依赖于硬件,模型效果很难复现,因此开源存在困难。
在这场没有Benchmark的竞赛中,各家厂商的探索与实践不断碰撞出火花,推动着机器人领域向前发展。这些“非共识”或许正是下一个影响机器人领域的关键所在。