ITBear旗下自媒体矩阵:

武汉大学RGMP架构突破:让人形机器人以几何智慧高效应对多样任务

   时间:2026-01-24 22:29:07 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

在人工智能领域,大语言模型凭借海量数据和庞大参数规模取得显著进展,但当聚焦于机器人领域,试图让机器人完成叠衣服、洗碗等日常任务时,这种依赖数据堆砌的方式却遭遇瓶颈。这便是机器人学界长期面临的“莫拉维克悖论”:计算机在智力测试中达到成人水平相对容易,可要拥有像一岁小孩那样的感知和行动能力却困难重重。不过,中国科研团队的一项新成果,为破解这一难题带来了新曙光。

此前,人形机器人的训练主要依赖“模仿学习”。像斯坦福大学的Mobile ALOHA、特斯拉的Optimus等,都是通过遥操作收集大量人类示教数据,再利用“扩散策略”让机器人复刻动作。这种方法在特定场景下表现尚可,但存在明显缺陷。一旦环境发生变化,如光线改变、物体位置偏移或出现新形状物体,机器人就会不知所措,出现“过拟合”现象,更像是机械执行指令的演员,而非具备理解能力的智能体。

武汉大学研究团队提出的“循环几何先验多模态策略”(RGMP)架构,为机器人训练开辟了新路径。该架构并非单纯追求更大模型参数或更多数据,而是赋予机器人基于几何学的“物理常识”。研究显示,搭载RGMP架构的人形机器人在面对全新任务时,成功率高达87%,数据训练效率是当前主流技术的5倍,这一成果为具身智能走出实验室指明了新方向,也彰显了中国在机器人核心算法领域的领先实力。

RGMP架构由“几何先验技能选择器”(GSS)和“自适应循环高斯网络”(ARGN)两大核心组件构成,分别解决机器人操作中的“该做什么”和“该怎么做”问题。其中,几何先验技能选择器(GSS)如同“战术指挥官”,将几何归纳偏置注入机器人视觉认知。传统视觉语言模型虽能识别物体,但缺乏对空间属性的理解,而GSS能让机器人在观察环境时实时解析物体三维几何特征,赋予其“空间直觉”。面对陌生物体,GSS无需匹配数据库样本,通过分析几何结构就能判断最佳操作策略,实现“零样本”或“少样本”适应。

自适应循环高斯网络(ARGN)则像是机器人的“运动小脑”,攻克了执行层面的难题。物理世界充满不确定性,传统深度学习策略难以应对。ARGN引入“高斯网络”对动作不确定性建模,结合循环神经网络特性,赋予机器人“短时记忆”能力。机器人在执行任务时,能记住过去动作趋势和接触反馈,动态调整后续动作,像人类一样根据触感微调力度和姿态,保持动作连贯性和稳定性。

在具身智能领域,数据效率是衡量算法商业落地潜力的重要指标。研究团队测试表明,与基于扩散策略的先进模型相比,RGMP达到同等性能所需训练数据量减少约5倍。在机器人研发中,高质量人类示教数据采集成本高昂,需专业人员佩戴昂贵设备进行长时间操作。RGMP的效率提升,大幅降低了机器人学习新技能的门槛。未来工厂机器人或许只需几次简单演示,甚至“看”一眼新产品3D模型,就能通过几何直觉生成操作程序。

RGMP展现出的87%全新任务成功率,证明其初步具备“举一反三”的通用能力。家庭环境复杂多变,传统机器人难以应对,而RGMP让“机器人保姆”从科幻走向现实成为可能。若机器人能依靠几何常识处理家务,在整理房间、清洁烹饪等任务中的表现将大幅提升。

目前,RGMP虽已展现强大适应性,但仍处于单步任务层面。研究团队计划赋予其更高级的自主规划能力,使其能推断复杂长程任务的动作轨迹。未来,机器人或许只需听到简单指令,就能自主规划一整套动作序列。该技术在工业制造、仓储物流和危险环境作业等领域也有广阔应用前景。在柔性制造车间,适应不同形状零件的机器人可提升生产线灵活性;在灾难救援现场,具备几何直觉的机器人能提高生存率和任务成功率。随着技术不断完善,机器人灵活操作万物的未来正加速到来。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version