ITBear旗下自媒体矩阵:

中国自研Matrix-3D:AI空间智能领域新突破,超越李飞飞World Labs

   时间:2025-08-12 15:03:37 来源:新智元编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在AI技术不断突破的今天,昆仑万维公司推出了其自主研发的Matrix-3D世界模型,这一技术革新使得仅凭一张图片就能生成一个可以自由探索的3D世界。这一成果不仅与斯坦福大学教授李飞飞的World Labs相媲美,而且在探索空间范围上更进一步,引领AI进入了理解世界的全新前沿。

长久以来,人类对于未知世界的想象只能停留在画布和梦境之中,现实与幻想的界限似乎总有一层无法触及的薄纱。然而,随着AI技术的飞速发展,这层薄纱正被逐渐揭开。Matrix-3D,一个能够“一图生万境”的世界模型,正是这一技术变革的见证。

Matrix-3D作为昆仑万维的首款全自研世界模型,是对其早期Matrix-Zero的全面升级。它不仅能够从一张山间草地的照片出发,创造出栩栩如生的全景风光,包括风吹草动、远山起伏等细节,还能从现代城市的一角“脑补”出繁华的街道和大厦,实现360度自由漫游的3D世界体验。

在昆仑万维的AI技术发布周上,Matrix-3D作为第二个亮相的模型,展示了其挑战空间智能核心痛点的能力。与现有的世界模型相比,Matrix-3D在场景全局一致性、生成范围、生成可控性、泛化能力和生成速度上均有显著提升。它支持360度自由视角浏览,几何结构准确,纹理风格统一,且能够生成更大范围的场景,满足用户自定义范围与无限扩展的需求。

在技术上,Matrix-3D引入了全景图像作为场景生成的中间表达形式,解决了传统透视图生成方法中的“边界效应”问题。通过全景图的拼接,Matrix-3D能够构建出连续的全景视频,为后续的3D世界生成提供了充足的数据基础。Matrix-3D还设计了全景图生成模块、可控全景视频生成模块和3D场景生成模块三个核心模块,实现了从文本或透视图到高质量3D场景的生成。

为了支撑这一技术的实现,昆仑万维还推出了Matrix-Pano数据集,这是一个基于Unreal Engine构建的可扩展全景视频数据集。该数据集包含11.6万条全景视频、2200万帧画面,覆盖504个高质量室内外场景,多种天气与光照条件,为3D生成和空间智能领域的研究提供了有力的数据支持。

Matrix-3D的应用前景广阔,它将在游戏与影视制作、具身智能、虚拟现实等多个领域发挥重要作用。在游戏开发中,Matrix-3D能够快速生成高质量3D场景,提升沉浸感并降低制作成本;在具身智能领域,它可以构建可控模拟环境,用于机器人训练与自动驾驶测试;在虚拟现实领域,Matrix-3D能够生成可360度自由探索的沉浸式虚拟空间,为用户带来真实可感的交互体验。

Matrix-3D的推出,标志着AI技术从“解读”图像向“走进”世界的转变,从“构想”场景向“创造”现实的跨越。这一技术突破不仅为AI理解世界提供了新的视角,也为人类探索未知世界打开了新的大门。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version