一支由英伟达、斯坦福大学与加州理工学院等顶尖机构组成的跨学科团队,近日宣布成功开发出一款名为NitroGen的开源人工智能模型。该模型突破传统大型语言模型(LLM)的边界,不仅能够驾驭超过千款电子游戏,更被视为构建通用具身智能体的关键技术突破。研究团队在公开论文中强调,这一成果标志着人工智能从虚拟世界向现实场景迁移的重要里程碑。
项目核心架构基于专为机器人技术设计的GROOT N1.5框架,这种独特设计使模型天然具备处理复杂动态环境的能力。研究团队通过分析超过4万小时的游戏直播视频数据,特别是包含玩家实时操作画面的素材,成功训练出具备跨游戏类型适应能力的智能体。实验数据显示,在程序化生成的游戏世界和全新游戏中,NitroGen的任务完成率较传统模型提升52%,展现出强大的泛化能力。
英伟达人工智能总监吉姆·范在技术分享中透露,该模型已实现从2D平台跳跃到3D竞速等15种游戏品类的全覆盖,包括角色扮演、生存竞技等复杂机制。他特别指出:"NitroGen展现的'玩家直觉'能力,本质上是快速动作决策系统的突破,这种能力在机器人控制领域具有直接应用价值。"目前模型已能通过单一神经网络架构同时处理视觉感知、动作规划和策略制定。
研究团队选择完全开源的技术路线,公开了预训练模型权重、完整动作数据集及源代码。这种开放策略已吸引全球开发者参与优化,特别是在机器人仿真训练领域,多家实验室正尝试将游戏场景中训练的决策模块迁移至实体机器人。吉姆·范坦言:"当前版本仅聚焦动作控制层面,后续将整合多模态感知系统,这需要跨学科团队的持续协作。"
该成果在学术界引发连锁反应,多所高校已启动基于NitroGen架构的衍生研究。技术观察人士指出,这种"以游戏训练智能"的路径,可能为自动驾驶、工业自动化等领域提供新的解决方案。随着开源社区的不断贡献,这个起源于游戏世界的AI模型,正在书写通用人工智能发展的新篇章。











