ITBear旗下自媒体矩阵:

蚂蚁灵波LingBot-VA开源:具身世界模型助力机器人精准操控与高效部署

   时间:2026-01-30 19:14:26 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁灵波科技近日宣布开源其最新研发的具身世界模型LingBot-VA,标志着该公司在机器人控制领域的技术探索迈入新阶段。这一模型基于此前发布的系列技术成果,包括空间感知模型、具身大模型和世界模型,进一步深化了世界模型在真实机器人场景中的应用实践。

LingBot-VA的核心创新在于提出了自回归的视频-动作世界建模框架。该框架通过将大规模视频生成能力与机器人动作控制系统深度结合,使模型在预测环境下一状态的同时,能够同步生成对应的动作序列。这种设计让机器人能够在动态感知环境变化的过程中,实时完成动作决策与执行,显著提升了复杂场景下的适应能力。

在真实机器人测试中,该模型展现出强大的任务处理能力。面对长时序操作、高精度控制以及柔性物体交互等六大类高难度任务,LingBot-VA仅需30至50条真实机器人演示数据即可完成模型适配。实验数据显示,其任务成功率较当前业界领先基准模型Pi0.5平均提升约20%,特别是在需要持续环境交互的场景中表现尤为突出。

仿真环境测试进一步验证了模型的先进性。在双臂协同操作基准测试RoboTwin 2.0中,LingBot-VA以超过90%的成功率刷新纪录;在长时序终身学习基准LIBERO测试中,平均成功率达到98.5%。这些数据表明,该模型在处理复杂时序逻辑和持续学习任务方面具有显著优势。

技术架构方面,LingBot-VA采用创新的Mixture-of-Transformers(MoT)设计,实现了视频感知与动作控制的跨模态深度融合。通过引入闭环推演机制,模型在每步生成过程中都会整合真实世界的实时反馈,有效避免了长期预测中可能出现的画面与动作偏离物理规律的问题。这种设计使机器人操作更符合真实环境约束。

针对机器人端侧部署的计算瓶颈,研发团队设计了异步推理管线。该方案通过并行处理动作预测与电机执行,结合记忆缓存技术和噪声历史增强策略,在减少生成步数的同时确保动作输出的稳定性。这种优化使模型既能保持高性能,又能满足低延迟控制需求,为实际工业应用奠定了基础。

此次开源的LingBot-VA与先前发布的LingBot-World、LingBot-VLA和LingBot-Depth共同构成完整的具身智能技术体系。这套技术方案聚焦于"世界模型赋能具身操作"的技术路径,为机器人领域提供了新的研发范式。目前,所有相关模型的权重参数和推理代码均已向研究社区开放。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version