ITBear旗下自媒体矩阵:

智元具身研究中心推出GenieReasoner,开源ERIQ评测基准助力VLA发展

   时间:2026-01-01 22:10:59 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

智元具身研究中心近日宣布,其研发的第二代一体化具身大小脑系统GenieReasoner正式问世。该系统针对视觉-语言-动作(VLA)模型中语义推理与动作控制模态对齐的挑战,创新性地提出统一离散化预训练架构,并通过流匹配技术突破了传统离散编码器在动作精度上的限制,为具身智能领域提供了新的技术路径。

在模型设计层面,研究团队构建了支持多模态统一表征的学习框架,使系统能够同时处理语义推理与精细动作控制任务。实验数据显示,GenieReasoner在跨本体真机测试中展现出卓越的泛化能力,其推理性能达到当前领域最优水平。特别值得注意的是,该系统在端到端动作执行任务中,通过强化具身推理能力显著提升了操作精度,验证了技术方案的有效性。

为推动行业标准化评估,研究团队同步开源了ERIQ评测基准。该基准聚焦真实机器人操作场景,通过解耦具身大脑的推理维度,实现了对空间理解、任务规划、动作预测等能力的量化评估。对比实验表明,ERIQ能够准确反映不同VLA模型的推理水平差异,为模型优化提供了可靠的评估工具。

技术实现方面,流匹配算法的引入有效缓解了离散化过程中的信息损失问题。通过动态调整编码空间与动作空间的映射关系,系统在保持语义完整性的同时,将动作控制精度提升了37%。这一突破使得机器人能够完成更复杂的操作任务,例如在非结构化环境中精准抓取细小物体。

当前研究团队正着力推进两个技术方向:一是深化逻辑推理能力,通过引入层次化认知架构提升系统对复杂任务的理解能力;二是优化执行精度,结合世界模型与真机强化学习技术,构建闭环控制系统。这些进展将为具身智能从实验室走向实际应用奠定基础。

ERIQ评测基准的完整代码与数据集已在开源平台发布,包含2000+真实操作场景、多维度评估指标及基线模型实现。研究团队表示,将持续更新评测任务,覆盖更多工业与家庭场景,推动具身智能技术的标准化发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version