英伟达高级研究科学家、具身智能项目负责人Jim Fan近日公布了一项名为“ENPIRE”的机器人科研新项目。该项目由8个AI编程代理与8台实体机器人组成科研团队,在无需人类研究员直接参与实验操作的情况下,这些代理可自主完成实验设计、代码编写、结果验证及策略优化等全流程工作。人类研究员仅需设定最终目标并观察实验结果,实现了科研环节的部分自动化。
实验平台为每个机器人单元配备了双6自由度机械臂、Intel RealSense深度摄像头及搭载NVIDIA RTX 5090显卡的工作站。所有计算任务均在本地完成,未依赖外部计算集群。研究团队测试了Codex、Claude Code和Kimi Code三种编程代理,发现Codex在真实机器人操作中表现最优,完成任务所需时间最短。Jim Fan将此项目称为“自动科研向物理世界延伸的首次尝试”,并戏称希望未来实验室能完全自主运行,甚至在团队休假时仍能持续推进研究。
与传统仅存在于数字世界的自动化科研系统不同,ENPIRE的核心突破在于让AI代理首次获得操作实体机器人的能力。过去,这类系统仅能通过代码生成数字结果,而ENPIRE中的代理可直接控制机械臂完成抓取、插入、剪切等动作。例如,在“Push-T”任务中,机器人需通过推动而非抓取的方式将T形积木移动至指定区域;在插针任务中,机器人需将直径4毫米的大头针精准插入孔洞;更复杂的任务还包括将GPU插入主板插槽及使用剪刀剪断扎带。
为应对真实世界的复杂性,研究团队将系统分为两个阶段:初期需少量人类参与构建“环境基础设施”,包括设定安全边界、开发自动重置机制及验证实验结果的模块。这些模块一旦完成,将作为后续所有实验的共享基础。第二阶段则完全由AI代理自主运行,它们通过阅读文献提出算法假设,修改训练代码,调整强化学习参数,并在真实环境中验证效果。例如,在插针任务中,代理通过尝试行为克隆、在线强化学习等多种方案,最终实现连续50次成功操作。
实验数据显示,增加机器人数量可显著缩短研发时间。在插针任务中,1台机器人需1.5小时达到高成功率,4台机器人缩短至50分钟,8台机器人则进一步压缩至40分钟。多个代理并行工作时,会同时探索不同技术路线,如修改奖励函数、调整训练基础设施等。有效方案通过Git自动共享,无效方案则被快速淘汰。这种协作模式类似于人类科研团队的分工,但效率更高。
研究还发现,AI代理可通过文字总结经验并迁移至新任务。完成插针任务后,代理生成的Markdown文档被用于GPU插入任务,显著提升了学习速度。这表明,系统迁移的不是模型参数或训练数据,而是方法论,与人类研究者记录实验笔记的方式相似。然而,ENPIRE仍存在局限性:实验平台依赖大量前期工程投入,且当前验证的任务多为结构化桌面操作,能否扩展至更复杂的开放环境尚待进一步测试。










