ITBear旗下自媒体矩阵:

蚂蚁灵波科技开源LingBot-VLA模型,推动具身智能跨本体跨任务落地新突破

   时间:2026-01-28 16:39:18 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团旗下灵波科技近日宣布,正式开源其自主研发的具身大模型LingBot-VLA,为机器人操作场景提供了一款具备跨本体、跨任务泛化能力的“智能基座”。这一模型通过降低后训练成本,显著提升了“一脑多机”的工程化落地可能性,标志着具身智能技术向实际应用迈出了重要一步。

在性能验证方面,LingBot-VLA展现了显著优势。在上海交通大学开源的具身评测基准GM-100(包含100项真实操作任务)中,该模型在三个不同机器人平台上实现了跨本体泛化平均成功率15.7%(未引入深度信息),较对比模型Pi0.5的13.0%有明显提升;当结合高精度空间感知模型LingBot-Depth引入深度信息后,成功率进一步跃升至17.3%,刷新了真机评测纪录。在RoboTwin 2.0仿真基准(50项任务)测试中,面对光照、杂物、高度扰动等环境随机化干扰,LingBot-VLA通过可学习查询对齐机制深度融合深度信息,操作成功率较Pi0.5提升9.92%,展现了从虚拟仿真到真实场景的全方位性能领先。

具身智能模型落地长期面临本体、任务、环境差异带来的泛化性挑战。传统开发模式下,开发者需针对不同硬件和任务重复采集大量数据进行后训练,导致成本高企且难以形成规模化交付路径。LingBot-VLA通过预训练阶段覆盖20000+小时大规模真机数据,涵盖AgileX、Galaxea R1Pro、R1Lite、AgiBot G1等9种主流双臂机器人构型,使同一“大脑”可无缝迁移至不同机器人,并在任务和环境变化时保持稳定性能。与LingBot-Depth配合后,模型能获取更高质量的深度信息表征,实现“看得更清楚、做得更明白”的视觉-动作协同优化。

在效率与成本优化方面,LingBot-VLA展现了显著优势。其基座能力使下游任务适配门槛大幅降低,仅需80条演示数据即可实现高质量任务迁移;配合底层代码库深度优化,训练效率达到StarVLA、OpenPI等主流框架的1.5至2.8倍,数据与算力成本实现双重降低。此次开源不仅提供模型权重,还同步开放包含数据处理、高效微调及自动化评估的全套代码库,大幅压缩训练周期,降低商业化落地的算力与时间门槛,助力开发者以更低成本快速适配自有场景。

蚂蚁灵波科技CEO朱兴表示,具身智能的大规模应用依赖于高效的基座模型,这直接决定了技术的可用性与经济性。通过开源LingBot-VLA,公司希望探索具身智能的技术上限,推动研发进入可复用、可验证、可规模化落地的新阶段,加速AI在物理世界的渗透普及。作为蚂蚁在AGI研发领域的又一探索性成果,LingBot-VLA是蚂蚁开源的首款具身智能基座模型,也是其InclusionAI技术体系与开源生态的关键实践。该体系涵盖基础模型、多模态、推理、新型架构及具身智能等完整技术链条,旨在通过开源开放模式携手全球开发者,加速技术迭代与规模化应用。

在数据采集与模型预训练阶段,LingBot-VLA得到了星海图、松灵等硬件平台支持,以及乐聚、库帕思、国家地方共建人形机器人创新中心、北京人形机器人创新中心有限公司、博登智能、睿尔曼等机构提供的高质量数据。目前,该模型已与星海图、松灵、乐聚等厂商完成适配,验证了跨本体迁移能力,为具身智能技术的产业化应用奠定了基础。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version