在具身智能领域权威评测榜单WorldArena Track1(世界模型感知与动作响应赛道)最新公布的测评结果中,智元自主研发的通用世界模型Genie Envisioner-Sim 2.0(GE 2.0)凭借综合性能优势脱颖而出,荣登赛道综合排名榜首。这一成绩标志着我国在具身智能核心技术研发领域取得重要突破,为机器人技术从实验室走向真实场景应用提供了关键支撑。
本次评测聚焦人形机器人智能化水平的核心指标,重点考察模型的环境感知、逻辑推理与动作响应能力。智元团队以原生版本GE 2.0参评,未针对评测题目进行专项优化,仅通过公开数据完成基础微调。这种"零定制"的参赛方式,充分验证了模型在通用场景下的适配能力与性能稳定性,为行业树立了新的技术标杆。
技术报告显示,GE 2.0在继承前代产品优势的基础上,实现了整体能力体系的系统性升级。该模型可构建动态可迭代的虚拟仿真环境,支持机器人在虚拟空间中进行自主推演与试错学习。通过模拟真实物理世界的运行规律,机器人能够积累操作经验、优化决策策略,显著降低现实场景中的调试成本,形成从感知预测到自主决策的完整技术闭环。
在功能模块建设方面,GE 2.0完成了多项关键能力突破。其覆盖长时序内容生成、多视角场景构建、本体状态模拟等核心模块,构建起完整的世界模拟器技术体系。特别在长时序推演任务中,模型展现出卓越的稳定性——在持续40至50秒的推演过程中,画面逻辑与场景连贯性始终优于行业基准方案,为机器人执行连续作业任务提供了可靠的技术保障。
为确保仿真环境的真实性,研发团队建立了多维度的闭环验证机制。通过海量实验数据对比发现,GE 2.0模拟场景与真实物理世界具有高度相关性。研究团队不仅从宏观层面进行效果对标,更通过逐案例分析、混淆矩阵量化等手段,系统验证了模型仿真结果的可靠性,为机器人策略评测与算法优化提供了精准的参考依据。
数据回流优化机制是GE 2.0的另一大创新。依托奖励模型能力,系统可自动筛选仿真过程中的高质量数据,形成"仿真-优化-再仿真"的迭代闭环。实验数据显示,该机制能持续提升算法性能,为模型持续进化提供稳定的数据支撑,有效解决了传统训练方式中数据利用率低、迭代周期长等痛点。
随着机器人技术从实验室研发向真实场景应用加速转型,行业对算法稳定性、实用性的要求日益严苛。智元团队正着力打通具身智能技术闭环,通过底层技术攻关与场景价值落地的双重驱动,推动世界模型技术真正融入现实生产生活,为人形机器人的规模化应用奠定坚实的技术基础。















