meta公司近日宣布,其研发的WorldGen系统取得突破性进展,这项创新技术能够通过简单的文本描述,快速生成具备交互性和导航功能的三维虚拟世界。该系统整合了程序化逻辑推理、扩散模型驱动的三维生成技术,以及面向对象的场景分解方法,确保生成的三维场景不仅几何结构精确,而且视觉效果丰富细腻,为游戏开发、模拟训练和沉浸式社交应用提供了全新的解决方案。
与传统方法相比,WorldGen在生成效率和一致性方面表现尤为突出。目前,该系统已能生成50米×50米范围的全纹理三维场景,场景中的建筑、地形等元素在风格和结构上保持高度统一。更值得关注的是,其生成的内容可直接导入Unity、Unreal等主流游戏引擎,无需额外适配,大大简化了开发流程。不过,meta方面透露,WorldGen目前仍处于研究阶段,尚未向外部开发者开放使用权限。
技术团队表示,WorldGen的核心优势在于其多技术融合的架构设计。程序化逻辑推理确保了场景的合理性,扩散模型则提升了视觉细节的真实感,而面向对象的分解方法则让复杂场景的生成变得高效可控。尽管已取得阶段性成果,但研究人员仍在持续优化系统性能,重点方向包括扩大生成场景的空间尺度,以及进一步降低生成过程中的延迟时间,以满足更广泛的应用需求。











