ITBear旗下自媒体矩阵:

智元机器人开源EVAC框架与EWMBench,助力具身智能研究新突破

   时间:2025-07-10 19:05:45 来源:珠江网编辑:快讯 IP:北京 发表评论无障碍通道
 

在具身智能领域,高昂的真机验证成本和有限的数据利用效率一直是阻碍研究推进的两大难题。近日,智元机器人宣布了一项重大举措,向公众开源了两项突破性成果:EVAC(EnerVerse-AC),一个基于动作序列驱动的具身世界模型,以及EWMBench,一个专为具身世界模型设计的评测基准。这一创新不仅标志着具身智能研究迈入了一个“算法与评测”协同进化的全新纪元,更为该领域的发展注入了强劲动力。

智元机器人凭借其深厚的技术积累,在EnerVerse世界模型架构的基础上,成功推出了EVAC与EWMBench。EVAC作为全球首个采用机器人动作序列驱动的世界模型,能够生动再现机器人与环境的复杂互动,实现了从静态仿真到动态生成式模拟的跨越。该模型通过引入多级动作条件注入机制,实现了“物理动作”与“视觉动态”之间的无缝衔接。其核心竞争力在于:高精度对齐机器人动作与像素,能够精确模拟多种复杂的动力学行为;支持动态多视图建模,确保从不同视角生成的视觉场景保持一致;具备出色的长时序一致性,使模拟过程更加连贯真实;通过融合相关数据集及失败轨迹,有效提升了生成质量,减少了幻觉现象。

EVAC的价值在于其双轮驱动机制:一方面,生成式仿真评估与数据引擎相辅相成。生成式仿真评测能够与待评测的策略模型进行交替推理,构建出交互式的评测流程,其评测结果与真机评测的成功率高度吻合,从而大幅提升了策略模型的筛选效率。另一方面,数据增广引擎能够基于少量的专家轨迹数据进行大规模的数据扩展,经过其训练的策略模型在任务成功率上实现了高达29%的提升。

为了科学、客观地衡量具身世界模型的性能,智元机器人推出了EWMBench,填补了行业在这一领域的空白,为业界提供了一个统一且可信的评测标准。EWMBench构建了“场景×动作×语义”的三维评估体系,从场景一致性、动作合理性以及语义对齐与多样性三个方面进行全面考核。其中,场景一致性采用经过微调的DINOv2特征进行量化;动作合理性则利用三重互补指标进行评估;语义对齐与多样性则结合了多模态大模型和CLIP进行评估。

EWMBench基于开源的百万真机数据集构建,涵盖了丰富的场景、任务以及交互对象,包含了300多个测试样本,其中30%为挑战性场景。同时,EWMBench还同步开源了全流程的评测工具,其评测结果与人类主观判断的一致性优于主流的视频生成评测基准VBench。EnerVerse为EVAC提供了基础框架与预训练能力,而EVAC生成的数据则反过来优化了EnerVerse,形成了一个“训练-验证”的闭环。EWMBench则在这一过程中发挥了关键作用,帮助精准定位EVAC的不足。这一组合方案已被相关赛事选为官方基线系统与评测标准,为开发者提供了一个实践与创新的平台。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version