埃隆·马斯克旗下的人工智能公司xAI正在加速推进其“世界模型”的研发,这一动作使其与meta、谷歌等科技巨头在下一代人工智能系统的竞争中处于同一赛道。这些新型系统旨在实现物理环境的自主导航与环境设计,被视为人工智能领域的重大突破。
世界模型是一种生成式人工智能模型,能够通过整合文字、图像、视频和动作等多模态数据,生成动态影片并模拟现实世界的物理特性。英伟达作为该领域的先行者,其Omniverse平台为创建和运行虚拟环境提供了技术支撑。据知情人士透露,xAI已从英伟达招募了两位具备相关经验的AI研究员——泽尚·帕特尔和何宜晖,以强化其研发团队。
与传统依赖文本训练的大语言模型不同,世界模型通过分析视频和机器人数据来理解现实世界。这种技术有望将人工智能的能力从文本交互拓展到三维空间操作。xAI计划将该模型应用于游戏开发,生成可交互的3D环境,未来还可能扩展至机器人系统。马斯克在社交平台X上宣布,公司目标是在2026年底前推出一款由AI生成的高质量游戏,并重申了这一时间表。
近期,xAI推出了最新一代的图像和视频生成模型,宣布其经过“重大升级”后将免费向公众开放。这一举措与当前主流的视频生成技术形成对比,例如OpenAI的Sora模型主要通过预测训练数据中的模式逐帧生成内容,而世界模型则能实时解析物理世界的因果关系,理解物体在不同环境中的动态交互。
尽管前景广阔,世界模型的研发仍面临严峻挑战。首要难题在于获取足够的数据来模拟现实世界并训练模型,这一过程既复杂又昂贵。目前,谷歌、meta等科技公司也在投入资源开发类似系统,但技术瓶颈尚未突破。英伟达曾向《金融时报》表示,世界模型的潜在市场规模可能接近当前全球经济总量,显示出行业对该技术的巨大期待。
游戏行业对世界模型的应用存在不同声音。《博德之门3》开发商拉瑞安工作室的发行主管迈克尔·道斯在社交媒体上指出,人工智能无法解决游戏产业的核心问题,即“领导力与远见的缺失”。他认为,行业更需要的是能吸引玩家投入的创意世界,而非依赖算法生成的玩法循环。这一观点反映了技术落地过程中可能面临的行业阻力。
截至目前,xAI及其招募的研究员尚未对相关报道作出回应。随着各大科技公司竞相布局,世界模型的竞争正从实验室走向实际应用,其发展轨迹或将重塑人工智能的未来格局。