英伟达联合卡内基梅隆大学与伯克利分校推出的ENPIRE框架,正在为具身智能研究开辟全新路径。这个由8个AI编程代理驱动的自主研究系统,通过控制双臂机器人集群,实现了从文献阅读到实验优化的全流程自动化。在无需人工干预的情况下,系统仅用3小时就将针插孔任务成功率从零提升至99%,展现出超越传统研究范式的潜力。
该框架突破性地将物理世界转化为可迭代的研究环境。通过环境模块的自动复位功能,机器人能在实验失败后自主恢复初始场景,解决了现实世界缺乏"env.reset()"命令的核心难题。在GPU插拔任务中,系统需完成从主板拔出、移动到指定位置、再返回初始状态的复杂力控操作,整个过程误差控制在毫米级。自动评分系统则通过多摄像头视觉检测,在150毫秒内完成扎带穿扎任务的成败判定,速度接近人类反应极限。
研究团队构建的闭环系统包含四大核心组件:环境模块负责场景搭建与安全控制;策略改进模块支持行为克隆、强化学习等多种算法混合试验;部署测试模块记录真实世界中的轨迹数据;进化模块通过Git实现多代理知识共享。这种架构使AI代理能像人类研究员般逐步优化方案——在针插孔任务中,系统自动经历了从行为克隆到强化学习,再到添加正则化项的完整优化路径。
面对复杂任务时,AI展现出惊人的自适应能力。在扎带剪切任务中,系统发现端到端训练效果不佳后,自主切换为"视觉定位+工具调用"的混合架构。这种根据任务特性动态调整研究路线的能力,模糊了自动研究与人类科研的界限。更令人瞩目的是经验迁移实验:将针插孔任务的研究笔记直接输入GPU插拔任务的提示词,显著提升了后续研究效率,这种非权重、非数据的经验传承方式与实验室传帮带模式高度相似。
该系统的扩展性验证了"物理Scaling"的可行性。当8个代理同时驱动8台机器人时,针插孔任务达到目标成功率的时间从单机的1.5小时缩短至40分钟。但这种扩展伴随显著成本增长:随着代理数量增加,代码阅读、经验同步等协作行为的token消耗呈指数级上升。研究团队为此引入机器人利用率和token利用率两个指标,量化评估系统效率。











