ITBear旗下自媒体矩阵:

苹果新AI模型Matrix3D:三张图即可重建3D场景,能力惊人

   时间:2025-05-14 14:06:35 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

苹果公司与学术界携手,在人工智能领域取得了一项突破性进展。据最新消息,苹果机器学习团队与南京大学及香港科技大学的科研团队共同研发出一款名为Matrix3D的3D人工智能模型,该模型能够在仅依靠少量二维照片的情况下,实现三维物体与场景的精确重建。

传统的摄影测量技术依赖于复杂的流程,包括姿态估计和深度预测等多个步骤,不仅耗时较长,而且容易出现误差。而Matrix3D则通过创新的方式,简化了这一繁琐过程。它能够接收图像、相机参数以及深度数据,利用统一的架构一次性完成所有处理任务,不仅显著提升了工作效率,同时也提高了重建的准确性。

Matrix3D的训练方式也别具一格。研究人员借鉴了Transformer架构中的掩蔽学习策略,通过在训练过程中随机隐藏部分输入数据,迫使模型学习如何填补这些信息空白。这一策略使得Matrix3D即使在面对较小或不完整的数据集时,也能实现有效的训练,从而保证了其强大的泛化能力。

实验结果显示,Matrix3D仅需三张输入图像,便能够生成出物体乃至整个环境的详细3D重建。这一成果无疑为苹果公司的沉浸式头显产品,如Apple Vision Pro等,提供了极为丰富的应用场景和想象空间。用户可以通过这些重建的3D模型,更加直观地了解物体和环境的真实情况,从而获得更加沉浸式的体验。

为了推动Matrix3D的进一步发展和应用,研究人员已经在GitHub上公开了模型的源代码,并在学术平台arXiv上发表了相关论文。他们还创建了一个官方网站,用户可以在其中观看更多示例视频,并亲自体验与一些物体和环境的点云重建进行交互的奇妙过程。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version