科技圈又迎来一则重磅消息:马斯克旗下的xAI正式进军世界模型领域。这一动作瞬间引发行业关注,meta、Google DeepMind等科技巨头或许都在思考,xAI此举是否会对自己形成直接挑战。
据《金融时报》报道,为在世界模型这场激烈竞争中占据优势,今年夏季,xAI成功从英伟达挖来多名资深研究员。这一举措无疑为xAI注入强大技术动力,也显示出其布局世界模型的决心。
就在xAI悄然布局世界模型后不久,马斯克在社交平台上再次提及去年定下的目标:到2026年底,xAI将推出一款极具影响力的AI生成游戏。这一目标引发外界广泛猜测,xAI的世界模型战略究竟与这款游戏有何关联。
世界模型近两年成为全球AI巨头和实验室竞相角逐的新领域。Google DeepMind、meta、NVIDIA以及李飞飞团队等都在积极投入研发。如今,xAI的加入让这场竞争愈发激烈。
xAI入局后的第一步,便是从英伟达“挖角”。今年夏天,xAI至少引入两位来自英伟达的研究人员:Zeeshan Patel和Ethan He。Zeeshan Patel今年5月刚从UC伯克利硕士毕业,研究领域集中在深度学习、生成模型和物理人工智能。加入xAI前,他曾在苹果AI/ML部门从事基础模型研究,之后进入英伟达研究院专注生成式世界模型研究,期间主要研发大规模多模态模型与训练框架。
Ethan He本科毕业于西安交通大学,随后前往CMU攻读计算机视觉硕士学位,并以优异成绩毕业。其Google Scholar被引数达8495。2019年至2021年,他在Facebook AI担任研究工程师,负责大规模视频自监督学习、视频基础模型等工作。2023年加入英伟达后,他的研究聚焦于MoE模型、多模态模型和世界模型,并于今年7月正式加入xAI。
这两位研究员有一个共同点:都曾参与英伟达Omniverse平台的核心开发工作。Omniverse是全球最成熟的仿真平台之一,被称为“通往物理世界的数字平行宇宙”。它作为英伟达打造的物理一致性仿真系统,广泛应用于机器人训练、3D建模、数字孪生、自动驾驶等领域,能够在虚拟世界中精准模拟现实物理规律,让AI在不接触现实的情况下学会与世界互动。这种能力正是世界模型研发所急需的。
有xAI内部人士透露,马斯克计划将英伟达在图形与物理模拟领域的技术积累,应用到xAI的世界模型体系中。这一计划若能实现,将为xAI的世界模型发展提供有力支持。
“世界模型”概念最早源于强化学习,旨在让AI在脑海中构建一个虚拟世界,用于规划行动和预测结果。如今,它被不少业内人士视为实现通用人工智能(AGI)的核心基础。AI教母李飞飞认为,世界模型应源自人类对世界的自然认知,是一种能让AI真正理解和推理物理3D世界的模型,而不仅限于文本处理。它能让AI理解3D结构、形状和组合性,从而推动机器人技术、创意产业和计算的未来发展,还能生成和重建持久存在、可导航的3D环境,支持多种应用,构建更大规模的虚拟世界和多元宇宙。
过去一年,这一方向成为AI巨头和实验室的竞争焦点。DeepMind推出Genie 3,能从图片或文字生成可交互的2D游戏世界;meta发布V-JEPA-2,让模型在视频中预测未来帧、理解物理因果;英伟达也在强化自身世界模型,用于机器人训练与数字孪生。
那么,xAI入局世界模型究竟有何意图?据知情人士透露,xAI的首批应用可能聚焦于电子游戏领域。目前,团队正尝试让AI自动生成自适应、逼真的3D场景,这些场景能根据玩家行为实时变化。这与马斯克设定的2026年底推出AI生成游戏的目标高度契合。
有用户在社交平台留言称:“AI在游戏开发中效率极高,能激发无限创造力,这一方向很有前景。”与此同时,xAI内部正在组建一支全模态团队,专门研究图像、视频、音频的综合理解与生成。近期公开的招聘信息显示,该团队涵盖多个方向:音频理解、生成与评测的技术人员,年薪区间18万-44万美元,侧重多模态建模与数据系统的人员。还有一个职位引发行业热议——电子游戏导师,时薪45-100美元,负责向模型讲解电子游戏机制、叙事逻辑和任务设计。这表明,马斯克希望借助人类专家的经验,让模型学会玩游戏、设计任务和构建可交互世界。
马斯克曾多次公开表示,xAI的使命是“让AI理解宇宙的本质”。世界模型正是实现这一目标的关键路径。拥有世界模型后,AI不仅能生成内容,还能在内部模拟出一个真实世界的副本。这意味着它既能驱动AI游戏,也能应用于智能体、自动驾驶乃至具身智能机器人。
从这一角度看,xAI、特斯拉、Neuralink之间的关系变得愈发紧密。xAI负责研发模型,特斯拉拥有机器人和自动驾驶数据,Neuralink提供脑机接口作为社交与实时反馈平台。若这些板块能通过世界模型实现互通,马斯克的AI帝国将形成一个完整的闭环。