阿里巴巴达摩院近日在具身智能领域取得重大突破,正式推出具备时空记忆与物理推理能力的RynnBrain基础模型,并同步开源包含30B MoE架构在内的7个全系列模型。该模型在环境感知、空间推理等16项具身智能评测中刷新行业纪录,超越谷歌Gemini Robotics ER 1.5和英伟达Cosmos Reason 2等国际顶尖模型,标志着机器人智能水平迈入新阶段。
传统具身模型发展面临两大核心挑战:动作模型因数据稀缺难以泛化,大脑模型虽具备泛化能力却缺乏动态记忆与物理认知。RynnBrain通过创新架构设计突破瓶颈,其时空记忆模块可追溯物体历史位置并预测运动轨迹,物理推理引擎则采用文本与空间定位交叉验证机制,有效消除传统模型中的"物理幻觉"问题。实验显示,搭载该模型的机器人在执行多任务时能精准记忆中断前的时空状态,任务切换后无需重新感知环境即可无缝续作。
该模型基于Qwen3-VL框架开发,通过自研RynnScale训练架构实现资源效率翻倍,训练数据规模超2000万组。在具身规划任务中,基于RynnBrain微调的模型仅需数百条数据即可超越Gemini 3 Pro性能,证明其作为行业基础模型的潜力。达摩院同步开源的RynnBrain-Bench评测基准,首次构建了涵盖时空细粒度任务的评估体系,填补了领域空白。
开源模型包含全尺寸基础模型与专用后训练模型,其中30B MoE架构模型通过动态参数激活技术,仅需3B参数即可达到72B模型的推理效果,显著提升机器人响应速度与动作流畅度。达摩院已形成完整技术矩阵,此前开源的WorldVLA融合模型、RynnEC世界理解模型及RynnRCP机器人通信协议,共同构建起可部署、可进化的具身智能系统。这项突破为通用具身智能的分层架构设计提供了关键支撑,加速人工智能从数字空间向物理世界的渗透进程。








