阿里巴巴达摩院近日宣布推出具身智能领域的重要成果——RynnBrain基础模型,并同步开源包含30B混合专家架构(MoE)在内的七个全尺寸模型。这一系列模型覆盖从基础架构到专业后训练的全链条,其中30B MoE模型作为全球首个同类架构的具身模型,通过降低推理资源需求显著提升了机器人响应效率,为行业研发提供了全新解决方案。
传统具身智能模型长期面临两大技术瓶颈:动态环境下的记忆丢失问题与物理空间认知偏差导致的"幻觉"现象。RynnBrain通过创新性的时空记忆模块与物理空间推理引擎,首次实现了机器人对三维空间的连续认知能力。该模型可基于历史轨迹预测物体运动方向,在复杂场景中保持环境感知的连贯性,其文本-空间交叉验证机制使决策过程更符合物理规律。
技术实现层面,研发团队基于Qwen3-VL架构进行深度优化,采用自研的RynnScale训练框架使同等算力下的训练效率提升200%。通过处理超过2000万组多模态数据,模型在环境感知、运动控制等16项核心指标上刷新行业纪录,综合性能超越谷歌Gemini Robotics ER 1.5和英伟达Cosmos Reason 2等国际领先模型。特别在资源利用率方面,30B MoE模型仅需激活30亿参数即可达到720亿参数模型的性能水平,大幅降低硬件部署成本。
为推动行业标准化发展,达摩院同步开源了RynnBrain-Bench评测基准。该基准包含200余项时空细粒度任务,涵盖动态物体追踪、空间关系推理等复杂场景,填补了现有评测体系在物理世界交互能力评估方面的空白。开源模型与评测工具的双重释放,为全球开发者提供了从算法优化到效果验证的完整工具链。
此次开源的模型矩阵包含1.5B至30B不同参数规模版本,支持从嵌入式设备到云端服务器的多场景部署。其中轻量化版本在保持核心功能的同时,将推理延迟控制在毫秒级,为服务机器人、工业机械臂等实时交互设备提供了可行的技术路径。行业分析师指出,这种全尺寸开源策略将加速具身智能技术从实验室走向商业化应用。










