ITBear旗下自媒体矩阵:

蚂蚁灵波LingBot-Map开源:以创新技术填补实时空间感知空白 赋能多行业

   时间:2026-04-17 01:21:35 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁灵波团队近日宣布,其自主研发的流式三维重建模型LingBot-Map正式开源。该模型突破传统三维重建技术框架,仅需单颗普通RGB摄像头即可实现实时空间感知,为机器人导航、自动驾驶等领域提供高精度三维建图能力。这一成果填补了实时三维重建领域的技术空白,标志着空间智能技术向轻量化、普适化方向迈出关键一步。

传统三维重建技术普遍采用"先采集后处理"的离线模式,存在计算延迟高、硬件依赖强等局限。LingBot-Map创新性地采用纯自回归式建模架构,通过几何上下文Transformer网络逐帧处理视频流,在不依赖未来帧信息的前提下,同步完成相机位姿估计与场景深度重建。这种"所见即所建"的实时处理能力,使模型在动态场景中仍能保持稳定输出。

技术团队引入的几何上下文注意力机制(GCA)是核心突破点。该机制通过智能筛选跨帧几何信息,在保留关键历史数据的同时削减冗余计算,使模型在长序列推理中既能维持重建精度,又能将计算开销控制在合理范围。测试数据显示,在Oxford Spires数据集上,LingBot-Map的绝对轨迹误差(ATE)较前最优流式方法降低62%,达到6.42米的行业领先水平,甚至优于离线方法DA3(12.87米)和VIPE(10.52米)。

在ETH3D、7-Scenes等国际权威基准测试中,LingBot-Map展现全方位优势。其重建F1分数达85.70,较第二名提升超8个百分点,场景结构还原精度显著提升。更值得关注的是,模型在保持20FPS实时推理速度的同时,支持超过10,000帧的连续视频处理,且长序列运行精度几乎无衰减,这种稳定性在复杂光照、大尺度场景等挑战性环境中尤为突出。

此次开源是蚂蚁灵波构建具身智能技术体系的重要布局。自年初以来,该团队已陆续开放高精度空间感知模型LingBot-Depth、具身大模型LingBot-VLA等核心组件。LingBot-Map的加入,完整补齐了从空间感知到决策控制的实时技术链条,为机器人等智能体提供了"感知-理解-行动"的全栈能力支撑。

目前,LingBot-Map的完整代码与预训练模型已在Hugging Face和Model Scope平台开放下载。开发社区可自由调用模型进行二次开发,或结合具体场景优化重建参数。技术文档显示,模型支持多种硬件平台部署,从嵌入式设备到云端服务器均可灵活适配,这种开放性设计将加速三维重建技术在工业巡检、物流仓储等领域的落地应用。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version