ITBear旗下自媒体矩阵:

蚂蚁灵波科技开源双模型:具身智能大提升,空间感知能力再上新台阶

   时间:2026-01-28 21:01:44 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁集团旗下蚂蚁灵波科技在机器人智能领域迈出重要一步,正式将具身智能大模型LingBot-VLA及配套后训练代码全面开源。这一决策不仅验证了模型在多类型机器人间的跨本体迁移能力,更通过技术共享推动行业生态发展。目前,该模型已与星海图、松灵、乐聚等机器人企业完成适配,形成覆盖工业、服务、教育等场景的应用矩阵。

技术团队开发的专用后训练工具链显著提升了模型迭代效率。在8卡GPU配置下,LingBot-VLA可实现每秒261个样本的训练速度,较主流框架StarVLA、OpenPI等提升1.5至2.8倍。这种效率突破直接降低了数据采集与算力投入成本,为中小企业参与高端机器人研发提供了技术可能。

基于海量真实场景数据训练的验证显示,模型性能与数据规模呈现强正相关。当预训练数据从3000小时扩展至20000小时,下游任务成功率实现阶梯式增长。在上海交通大学开源评测基准GM-100的测试中,模型在三种不同硬件平台上的跨本体泛化成功率从13.0%提升至15.7%,引入深度信息优化后更达到17.3%的突破性表现。

同步推出的LingBot-Depth空间感知模型聚焦三维视觉重建难题。该模型通过双目3D相机采集RGB-Depth数据,可将受噪声干扰的不完整深度信息转化为高精度三维测量结果。在深度补全和单目深度估计等基准测试中,其精度与稳定性指标均达到行业领先水平,为机器人导航、自动驾驶等领域提供了更可靠的环境感知解决方案。

技术文档显示,LingBot-Depth模型特别优化了动态场景下的数据处理能力。在模拟测试中,面对快速移动物体产生的深度数据缺失,模型仍能保持87%以上的重建准确率。这种特性使其在物流分拣、无人配送等时效性要求高的场景中具有显著应用优势。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version