智元具身研究中心近日宣布,正式推出第二代一体化具身大小脑系统GenieReasoner。该系统针对视觉语言动作(VLA)模型中语义推理与动作控制的模态对齐难题,创新性地提出统一离散化预训练架构,并引入流匹配技术突破传统离散Token化的动作精度限制。这一突破性进展为具身智能领域提供了新的技术路径。
为系统化评估具身推理能力,研究中心同步开源了ERIQ评测基准。该基准聚焦真机操控全流程,通过解耦设计量化评估具身大脑在空间理解、任务规划、动作预测等维度的推理表现。实验数据显示,GenieReasoner在多个基准测试中达到当前最优水平(SOTA),尤其在跨本体真机实验中展现出卓越的泛化能力,验证了其技术架构的普适性。
对比实验进一步揭示,具身推理能力的提升可显著优化端到端动作执行效果。研究团队通过控制变量实验证明,ERIQ基准能够有效区分不同模型的推理层级差异,为技术迭代提供了可靠的评估工具。这一发现不仅验证了GenieReasoner的技术优势,也为VLA模型的发展方向提供了实证依据。
目前,智元具身研究中心已将ERIQ基准完全开源,相关代码与数据集可通过指定项目地址获取。研究团队表示,后续将围绕"逻辑深度"与"执行精度"双维度持续优化,重点推进具身大小脑系统、世界模型与真机强化学习的闭环协同,为具身智能的产业化应用奠定技术基础。








