ITBear旗下自媒体矩阵:

​自变量王潜谈机器人进化:通用具身模型赋能,让机器人“大脑”更强大​

   时间:2025-09-16 03:17:32 来源:新华社编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在2025年世界机器人大会上,自变量机器人公司凭借其创新技术成为焦点。展台上,轮式双臂机器人“小量”正以一双灵巧的手制作传统香囊,而仿人形机器人“量子2号”则通过7自由度手臂设计,完成捏薯片不碎、360°无死角清洁等高难度任务。这些操作的背后,是自变量自主研发的通用具身大模型WALL-A——一款通过“一脑多用”端到端技术实现零样本泛化的机器人“大脑”。

“没有‘大脑’的机器人,就像一块失去灵魂的铁木。”自变量创始人王潜指出,当前人形机器人虽已实现走路、跑步甚至打拳踢球,但真正制约其进入工厂和家庭的核心,仍是理解物理世界并自主决策的能力。他以推门动作为例:手的接触点位置、力度方向、摩擦系数等参数的微小差异,都会导致完全不同的结果。这种物理世界的随机性,正是传统分层模型或专用模型难以应对的挑战。

王潜将传统技术路线比作“搭积木”:视觉识别、推理规划、动作生成由不同模型分层处理,信息传递如“传话游戏”,误差层层累积。而理想的具身智能模型应像人脑一样,将视觉、语言、触觉、动作等多模态信息统一处理,实现“看见-思考-行动”的无缝衔接。自变量的解决方案是将世界模型与端到端通用模型融合,通过一个神经网络覆盖从信号输入到动作输出的全流程。

这种设计在实测中展现出显著优势。当机器人“小量”接到穿衣服指令时,若遇拉链变形或衣物掉落,端到端模型可通过“实时感知决策闭环”快速调整策略,而传统分层模型则需重新编程。更令人惊讶的是,当被告知所在家庭有儿童时,“小量”会主动将水果刀存放在更高处的抽屉——这一逻辑推理源于对儿童安全的预判。

“泛化能力是区分模型优劣的关键。”王潜解释,优秀模型需具备从光照位置到操作任务的四级泛化能力,以及处理操作动作、推理复杂度、物体形态等多维度任务的能力。例如,装载通用大脑的机器人能精准拾取地面上的废纸、塑料瓶等不规则垃圾,或将沙发上随意堆放的衣物分类放入脏衣篓。

训练这样的“大脑”,数据比算法更关键。王潜透露,自变量构建了全球最大的具身智能数据集,涵盖数万小时的机器人操作视频、触觉反馈和空间定位数据。为提升效率,团队研发了物理准确性最高的视频生成模型,通过切换背景、环境参数和接触过程,将一条真实数据扩展为上千条,以快速增强模型泛化性。“数据质量比数量更重要,而多元性是提升质量的核心。”

当被问及机器人软硬件的匹配阶段时,王潜明确表示:“具身智能是典型的‘软件定义硬件’领域。”他以自动驾驶类比:后者核心难点在导航与运动,而机器人需攻克的是复杂操作。例如,人形机器人公司短期内训练娱乐能力虽能提供情绪价值,但长期来看,操作能力才是进厂入户的关键。

目前,自变量的通用具身大模型已能处理穿衣、削苹果、整理垃圾等动态任务,并在逻辑推理中展现类人思维。王潜强调,物理世界的复杂性要求模型必须具备“边想边做”的能力,而非简单叠加功能模块。这种技术突破,或许正为人形机器人从“演示品”迈向“生产力”铺平道路。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version