ITBear旗下自媒体矩阵:

阿里Qwen团队发布机器人三大基础模型 赋能机器人“思考”“行动”与“预测”

   时间:2026-06-17 13:33:13 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

Qwen团队近日宣布推出一套全新的机器人套件,包含Qwen-RobotNav、Qwen-RobotManip与Qwen-RobotWorld三大基础模型。这一创新成果标志着语言与物理动作的深度融合迈入新阶段,为机器人执行复杂任务提供了更智能的解决方案。

Qwen-RobotNav专注于移动控制领域,通过可控观测编码和工具接口技术,将视觉语言能力转化为精准的移动指令。该模型实现了指令跟随、点/目标导航、目标追踪和自动驾驶四类任务的统一处理,使机器人能够根据语言指令完成动态环境中的路径规划与实时调整。

在操作控制方面,Qwen-RobotManip通过标准化状态-动作空间和末端执行器增量位姿计算,构建了视觉语言与机械臂控制的桥梁。基于超过38,100小时的开源数据语料库,该模型支持多机型训练,能够准确理解"抓取左侧杯子"或"调整工具角度"等复杂操作指令。

Qwen-RobotWorld则开创性地引入自然语言动作接口,将视觉语言能力扩展至世界动态预测。该模型突破单一场景限制,可同时处理操作、驾驶和导航场景下的物理规律预测,例如通过语言描述就能模拟"推倒积木后其他物体的运动轨迹"等复杂物理现象。

三大模型均采用语言优先接口设计,可与通用大模型无缝对接组成物理智能体系统。实际测试中,Qwen团队已验证该系统能完成从语言理解到物理任务执行的完整闭环,包括实时任务分解、多步骤推理和自主纠错能力。例如当机器人执行"将红色方块移到蓝色区域"任务时,若途中遇到障碍物,系统会自动重新规划路径并调整操作策略。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version