ITBear旗下自媒体矩阵:

自变量王潜谈机器人进化:突破“精密废物”困局,关键在“大脑”模型革新

   时间:2025-09-16 07:18:29 来源:新华社编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在2025世界机器人大会上,自变量机器人公司展出的两款机器人引发行业关注。轮式双臂机器人“小量”以灵巧的双手完成香囊制作,仿人形机器人“量子2号”则通过7自由度手臂设计,实现了捏薯片不碎、360°清洁等精细操作。这些突破性表现背后,是该公司自主研发的通用具身大模型WALL-A,其“一脑多用”的端到端技术使机器人具备零样本泛化能力,标志着机器人技术从演示阶段向实用化迈进。

自变量机器人创始人王潜指出,当前人形机器人已从“动弹不了”的阶段,发展到能走路、跑步、打拳甚至踢球。但真正制约其进入工厂和家庭的核心障碍,并非机械结构的完善程度,而是缺乏能深刻理解物理世界、自主决策的“更强大脑”。“没有大脑驱动的机器人就像失去灵魂的铁木,只能表演无法实干。”他比喻道。

针对机器人大脑技术路线的争议,王潜明确表示,现有大语言模型、多模态模型或视觉语言大模型均属于虚拟世界的基础模型,无法直接应用于物理世界。他以推门动作为例:手的接触点位置、接触时长、力的方向等参数差异,会导致完全不同的结果,这种随机性是虚拟模型难以处理的。物理世界的0.1%误差可能引发10%-20%的操作偏差,这是当前机器人泛化能力不足的根本原因。

与传统分层模型相比,自变量采用的端到端通用具身智能模型具有显著优势。该模型将视觉、语言、触觉、动作等所有模态信息统一处理,形成从信号输入到动作输出的完整闭环。实验显示,搭载该模型的“小量”机器人在削苹果时,能根据“有小孩的家庭”这一指令,主动从更高处的抽屉寻找水果刀以避免危险。而在穿衣服任务中,面对拉链变形等突发状况,模型仅需少量样本即可完成策略调整,无需重新编程。

在数据积累方面,自变量构建了全球最大的具身智能数据集,涵盖数万小时的机器人操作视频、触觉反馈和空间定位数据。为提升数据效率,公司研发了物理准确性最高的视频生成大模型,通过切换背景、环境和接触物理过程,将一条真实数据扩展为成百上千条模拟数据。王潜强调:“数据质量比数量更重要,扩大数据多元性是提升模型泛化能力的关键。”

关于机器人能力与实际需求的匹配度,王潜坦言,当前跑步、跳舞等运动能力与工业、家庭场景所需的复杂操作能力存在较大差距。他以通用能力框架分析,机器人的核心竞争力在于操作维度,而非运动或导航。不过他也指出,在技术尚未完全成熟的阶段,开发娱乐能力能为机器人提供情绪价值,帮助企业维持发展。

对于硬件与软件的协同关系,王潜认为具身智能是典型的“软件定义硬件”领域。他透露,自变量正根据模型进化需求重新定义硬件标准,确保机械结构能充分释放大脑潜力。这种软硬协同的研发模式,或将成为未来机器人产业的核心竞争力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version