滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

香港理工大学新突破：3D重建AI借多视角“自我纠错”提升精度

时间：2026-04-23 22:50:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当手机拍摄的多张照片被AI转化为三维空间模型时，这个看似智能的过程实则暗藏隐患——AI模型仅凭训练阶段积累的有限经验进行推测，在面对镜面反射、物体遮挡或复杂光照场景时，往往会产生几何形变、深度失准等隐蔽错误。香港理工大学团队提出的创新框架Free Geometry，通过让AI模型在推理阶段实现自我优化，成功突破了这一技术瓶颈。

传统三维重建模型采用"训练即冻结"模式，如同背熟教科书的考生面对新题型时束手无策。以VGGT和Depth Anything 3为代表的顶尖模型，在ETH3D数据集的镜面反射场景中，墙面倾斜误差可达5度以上，物体边缘的"毛刺"现象使重建精度下降37%。研究团队发现，当输入图片数量从4张增至8张时，相机位姿精度提升40%，三维点云F1分数提高28%，这揭示了多视角信息对模型判断的关键作用。

Free Geometry框架创造性地构建了"师生模型"机制：完整观察场景的"教师模型"提取高质量特征，部分观察的"学生模型"通过轻量级LoRA模块进行参数微调。在ETH3D数据集测试中，该框架使VGGT模型的相机位姿精度从0.157提升至0.178，三维重建F1分数从0.102增至0.110，特别在视角稀缺场景下提升幅度达5.33%。整个自适应过程仅需更新0.2%的模型参数，在单张专业显卡上2分钟内即可完成。

技术实现层面，研究团队设计了双重约束机制：帧内一致性损失确保可见视角特征对齐，跨帧关系损失通过构建特征空间三角形捕捉遮挡区域的几何关系。实验显示，混合选取相似与不相似的锚点特征效果最佳，LoRA模块的秩数设置为32时达到精度与效率的平衡。在ScanNet++数据集的复杂室内场景中，适应后的模型使深度估计误差减少23%，几何一致性提升41%。

该框架的突破性在于完全摆脱人工标注依赖，其自监督信号源于模型自身对多视角信息的自然处理。对比传统测试时自适应方法，Free Geometry在编码器特征层面操作，避免了输出层一致性约束可能导致的"劣币驱逐良币"现象。在7-Scenes数据集的动态光照测试中，模型对反光表面的重建准确率提升29%，对遮挡物体的深度预测误差降低35%。

跨视角泛化实验验证了框架的普适性：适应后的模型在4至100张输入图片范围内均保持精度提升，在HiRoom高分辨率数据集上，32视角下的相机位姿精度仍提升2.89%。消融研究显示，移除跨帧关系损失将导致F1分数下降11.4%，证实了几何关系约束对消除重建歧义的核心作用。目前研究团队已开源代码，为三维扫描、机器人导航等领域提供即插即用的解决方案。

更多>同类资讯

地平线推出整车智能全栈方案，舱驾融合或开启智能汽车新篇章

04-23

AI浪潮下短剧行业变革：霸道总裁演员转行回乡务农求生

04-23

荣耀机器人夺冠背后：战略布局与技术积淀共筑AI终端新未来

04-23

荣耀机器人“闪电”夺冠：战略深耕与技术积淀下的必然突破

04-23

蓝思科技入局普渡机器人：资本绑定与技术输出共筑机器人智造新平台

04-23

华为乾崑技术大会：10项车载核心技术发布，WEWA 2.0架构等多项创新引领未来

04-23

全新BMW 7系：以光影声韵交织，重塑旗舰豪华的沉浸式体验新境界

04-23

特斯拉第三代人形机器人年中亮相在即，2026年投产并明年投用外部场景

04-23

OpenAI意外“剧透”未来：GPT-5.5等新模型浮出水面，AI竞争再升级

04-23

FAIR plus 2026深圳机器人展启幕 2025年产业总产值突破2400亿创新高

本届展会汇聚500余家机器人全产业链上下游企业，集中展示工业机器人、人形机器人、服务机器人、具身智能及核心零部件等最新产业化成果，展会现场同步发布《深圳市机器人产业发展白皮书（2025年）》。本届展会汇聚50…

04-23

OpenAI算力扩张加速：已锁定8GW资源，2030年目标直指30GW

IT之家 4 月 23 日消息，OpenAI 官方当地时间昨日宣布，这家人工智能企业当前已锁定总功率超 8GW 的算力资源，离 2025年初设立的 10GW 目标已经不远，而到 2030 年则将达到 30G…

04-23

未来移动通信论坛发布多项成果，为6G发展铺就多维技术新路径

6G前沿技术丛书、“6G前沿技术与产业生态”报告、6G技术系列白皮书及数据集在内的未来移动通信论坛多项成果发布。丛书编委主任、中国移动研究院首席科学家易芝玲在丛书发布仪式上表示，从6G网络架构、6G通信能…

04-23

庆阳“东数西算”新篇：绿电赋能算力跃升数字引擎驱动未来

近日，由国务院国资委主办的“走进新国企聚势启新程”媒体行活动走进甘肃庆阳，来自全国十余家主流媒体的记者近距离了解这座黄土塬上的“算力之城”。中国移动甘肃公司副总经理马世科说，“十四五”时期，该公司在庆阳…

04-23

大连发力智改数转：2026年增1500座5G基站 2028年建超百个智能工厂

到2026年底，大连力争新增5G/5G-A基站1500座，加速工业网络全域覆盖；到2028年底，累计培育省级工业互联网平台47个，完成400家重点工业企业网络和数据安全分类分级管理，同步建成先进级智能工厂11…

04-23

尤肖虎院士谈6G：AI赋能下终端形态将变，未来或迎换机潮

尤肖虎认为，6G网络的重要使命，就是要把AI应用很好地支撑起来，而现有网络在这方面还有明显差距。可以说，6G网络的一个重要使命，就是要把AI应用很好地支撑起来，而现有网络在这方面还有明显差距。比如通过P…

04-23

点击查看更多 +

全站最新

三一重工(06031.HK)获摩根大通增持21.9万股

樾系标杆落地！香山樾交付，彰显越秀在京高端人居打造硬实力

海尔智家(06690.HK)获Pzena Investment Management, LLC增持180.92万股

康臣药业（01681.HK）投资者交流日：稳增长、高分红双轮驱动获青睐

华为乾崑智驾里程突破100亿公里，迟林春称10月有望超特斯拉登顶全球

当乳业进入"科技时代"，飞鹤以"原料自研、鲜活标准、全龄布局"给出答案

热门内容

本栏最新

吉利银河M9黑金智曜版焕新登场豪华智能驾控升级引领大六座SUV新风潮

短视频运营：厘清“获客”与“涨粉”逻辑，精准发力收获真客户

2026北京车展：荣威家越07概念车首发聚焦AI时代家庭出行新方案

2026梅赛德斯 - 奔驰品牌日：全新纯电GLC SUV亮相，新一代S级中国首秀

2026北京车展荣威展台新亮点家越07概念车大5座SUV定制AI出行方案

第57次报告发布：2025年我国互联网向“新”向“好” 成果斐然筑牢发展基石

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.