ITBear旗下自媒体矩阵:

蚂蚁灵波科技再发力:LingBot-Map开源,单摄像头实现实时三维重建新突破

   时间:2026-04-16 17:47:29 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

蚂蚁灵波科技近日正式对外开源其自主研发的流式三维重建模型——LingBot-Map,这一技术突破为机器人导航、自动驾驶及增强现实(AR)设备等领域带来了新的可能性。该模型仅需单个普通RGB摄像头,即可在视频采集过程中实时完成相机位姿估计与场景三维结构重建,为需要即时空间感知的应用场景提供了高效、稳定且连续的在线建图解决方案。

与传统方法需预先采集完整视频序列后再进行统一处理不同,LingBot-Map采用了流式处理架构,实现了边接收画面边输出定位与结构信息的实时交互。这种设计显著提升了处理效率,尤其适用于对实时性要求极高的场景。在国际权威评测中,该模型表现优异:在极具挑战性的Oxford Spires数据集上,其轨迹误差仅为当前最优流式方法的三分之一,甚至超越了部分离线处理算法。性能测试显示,LingBot-Map支持约20帧每秒的实时推理,且在处理超万帧的长视频时,精度几乎无衰减,兼顾了高精度、高速度与长时稳定性。

此次开源的LingBot-Map是蚂蚁灵波科技在具身智能领域的重要布局之一。此前,该公司已陆续发布深度估计(Depth)、大语言动作模型(VLA)及世界模型(World)等系列成果,而LingBot-Map的加入进一步补齐了实时空间理解这一核心环节,完善了其具身智能“基座”的技术体系。通过降低高精度三维感知对硬件的依赖,该模型有望推动具身智能设备在复杂动态环境中的感知与决策能力升级。

目前,LingBot-Map已通过开源平台向全球开发者开放,用户可通过以下链接获取模型资源:Hugging Face(https://huggingface.co/robbyant/lingbot-map)与ModelScope(https://www.modelscope.cn/models/Robbyant/lingbot-map)。这一举措预计将促进相关领域的技术创新与生态发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version