滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁集团AI新突破：LingBot-Map让机器实现“边走边建”精准三维地图

时间：2026-04-27 01:35:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在计算机视觉领域，机器如何像人类一样实时感知并重建三维空间，一直是无人驾驶、增强现实和机器人导航等应用的核心难题。蚂蚁集团旗下研究团队提出的新系统LingBot-Map，通过模仿人类空间记忆机制，在流式三维重建任务中实现了突破性进展。该系统以每秒20帧的实时速度处理千帧级长视频，在多个公开基准测试中超越传统离线优化方法，相关成果已预印本形式发布于arXiv平台。

传统方案面临双重困境：单目摄像头获取的二维图像缺乏绝对距离信息，而实时处理要求系统必须边接收数据边计算位置。随着视频长度增加，微小误差会像滚雪球般累积，导致重建的地图逐渐"漂移"；若保存所有历史帧的完整信息，内存消耗又将呈线性爆炸式增长。研究团队从人类认知模式中汲取灵感，将空间记忆分解为三个层级：固定起点的锚定坐标系、记录近期轨迹的局部窗口、压缩历史路径的全局摘要。

系统核心的几何上下文注意力机制（GCA）通过三层记忆架构实现高效计算。初始帧被设定为锚点，建立坐标系和比例尺基准；最近16-64帧构成局部窗口，提供密集的几何比对线索；历史帧则被压缩为仅含6个参数的"摘要令牌"，记录摄像机位姿的核心信息。这种设计使每新增一帧仅增加6个计算单元，相比传统方法需要处理500个完整图像令牌，内存占用降低近80倍。研究团队特别引入视频时序位置编码技术，为历史摘要添加时间标记，确保系统能感知帧间先后顺序。

训练阶段采用独特的两阶段策略：基础模型先在29个数据集的短序列上预训练几何推理能力，消耗2.15万GPU小时；流式模型再通过渐进式视图课程学习长序列处理，从24帧逐步扩展至320帧，配合相对位姿损失函数强化局部一致性。针对数据多样性问题，团队开发了折返视频采样器，通过随机步长和折返策略生成自然变化的训练片段，并整合Habitat-Sim仿真环境生成跨房间导航数据，使模型能应对剧烈场景切换。

在牛津尖塔数据集的3840帧超长序列测试中，LingBot-Map的绝对轨迹误差（ATE）仅7.11米，而同类最佳流式方法达到32.47米，甚至超越需要全局优化的离线系统。ETH3D数据集上的点云重建F1分数达98.98%，较次优方法提升22个百分点。可视化结果显示，其他方法因轨迹漂移导致建筑边缘出现重影，而该系统生成的点云轮廓清晰、墙面连续。

系统支持直接输出和视觉里程计两种推理模式。前者适用于3000帧以内的常规场景，后者通过局部窗口拼接处理城市级长视频，虽牺牲少量精度但实现内存恒定。关键帧选择机制根据光流变化动态保留信息，配合分页KV缓存技术将推理速度提升至每秒20帧。实验表明，固定局部窗口比完整因果注意力内存下降2.7倍，轨迹精度反而更高，证明针对性保留关键信息比堆砌数据更有效。

这项研究为实时三维重建提供了新范式。相比依赖激光雷达的高成本方案，LingBot-Map仅需普通摄像头即可工作，显著降低自动驾驶、增强现实等领域的部署门槛。目前系统尚未实现主动闭环检测，在极端长序列中可能丢失细节。研究团队计划将闭环机制融入注意力计算，并探索动态场景处理和多传感器融合方向，相关代码和演示资源已公开于GitHub仓库。

更多>同类资讯

美的AIRC研究院推出SemaClaw框架：为AI智能体打造可靠"驾驭装置"

04-27

2026北京车展：中国端侧大模型上车，能否成汽车出海“新引擎”？

04-27

安波福CEO：AI成汽车产业必答题，机器人等新市场潜力远超汽车

04-27

AI生图浪潮下，设计师如何以专业判断筑牢价值护城河？

04-27

壁仞科技助力中国移动：九天35B大模型完成适配国产化算力再进一步

04-27

《AI原生》发布：探讨人机共生新趋势助力重构人类独特价值

04-27

GPT5.5深夜突袭发布，OpenAI凭实力打响翻身漂亮仗

但在这次更新中，OpenAI官方称GPT5.5在智能水平大幅提高的同时，真实服务中的速度与GPT5.4保持了一致。OpenAI联合创始人兼总裁格雷格·布罗克曼（Greg Brockman）提到这一点时表示，…

04-27

从预测到深思：OpenAI o1模型开启AI“类人推理”新纪元

这种模式在语言任务上表现出色，但在需要多步推理、逻辑一致性和规划能力的任务上存在根本局限：它们倾向于生成“看起来合理”而非“正确”的答案。 o1模型系列（包括o1和更高阶的o1-2025）最革命性的特性是引入…

04-27

具身智能机器人保险新突破：首批理赔落地，产业配套逐步完善

“在具身智能机器人第三方评估和维修机构体系尚未完全成熟的阶段，由保险公司与主机厂协同开展损失确认，是当前机器人保险定损的重要路径之一。” 据悉，擎天租与人保财险自2025年12月开始合作，推出覆盖“机器人本…

04-27

第九届宿州市青少年机器人竞赛落幕科技少年共赴创新盛宴

此次大赛是对宿州市青少年科技素养的一次综合检验，宿州市青少年宫一贯重视青少年科技素养的培育和发展，通过此类活动更好的搭建更多优质平台，鼓励青少年积极参与科创类活动，为培养具有独立创新精神和实际实践能力的新时代…

04-27

DeepSeek API输入缓存价格大跳水，Pro模型限时2.5折优惠来袭

04-26

捷达品牌焕新启航，智能电动转型加速，两年内将推四款新能源车型

04-26

地平线迈向汽车“操作系统层”：新角色能否获车企认可与市场验证？

04-26

GPT-5.5 Pro突破门萨智商门槛：AI认知革命加速，未来已来

04-26

OpenClaw适配DeepSeek-V4：国产大模型赋能智能体开发，重塑行业新格局

04-26

点击查看更多 +

全站最新

追觅CEO俞浩直指小红书：社会价值观导向差，平台不应靠作恶盈利

北京车展比亚迪大放异彩：技术矩阵领航，产品矩阵进化，全球化加速

华为智擎+超充网络双轮驱动，以技术创新解锁电动汽车体验升级新赛道

7岁“老小米”车展狂赞小米超跑雷军发文回应：看看懂车弟咋评价

华为余承东“自我反思”：做车曾重安全品质轻外观，现颜值实用两手抓

马自达2今夏日本停产紧凑型轿车遇冷市场格局生变？

热门内容

本栏最新

思想碰撞启新程荣耀加冕展风采：未来论坛与颁奖礼共绘车展华章

东风汽车“东方风起2030”：体系化布局引领产业升级新征程

国家超算互联网携手DeepSeek-V4 开启百万上下文对话普惠新篇章

2026北京车展红旗全矩阵登场：技术自研+生态共创开启中式豪华新篇章

东风汽车2026北京车展展宏图：“东方风起2030”引领未来出行新方向

特斯拉中国辟谣小型SUV开发计划强调战略重心转向AI与自动驾驶领域

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.