麻省理工学院计算机科学与人工智能实验室(CSAIL)联合丰田研究院,共同开发了一款名为“可引导场景生成”的生成式人工智能工具。该工具通过构建虚拟训练环境,为机器人学习能力的提升开辟了新路径,能够模拟厨房、客厅、餐厅等生活场景,帮助工程师测试机器人应对实际任务的能力。
这款工具的核心优势在于其“可引导”特性。研究团队基于超过4400万个3D房间数据对系统进行训练,并引入“蒙特卡洛树搜索”(MCTS)策略。该策略通过序列决策过程,使AI模型能够动态选择场景生成选项,例如优化场景的真实性或增加物体复杂度。MIT博士生、CSAIL研究员尼古拉斯·帕夫指出,这一技术首次将MCTS应用于场景生成领域,通过逐步构建部分场景,最终生成比传统扩散模型更复杂的训练环境。
行业专家认为,该技术有效解决了机器人学习中的关键瓶颈——高质量训练数据的缺乏。亚马逊机器人应用科学家杰里米·比纳吉亚评价称,这一方法不仅保证了物理可行性,还能生成更具挑战性的场景,为机器人适应复杂环境提供了可能。研究团队进一步强调,其引导方法能够生成多样化、符合任务需求的真实场景,从而提升机器人训练的针对性。
目前,该系统仍处于概念验证阶段,但研究团队已规划长远目标。他们计划扩展更多对象和环境类型,最终实现通过生成式AI创建全新资产,而非依赖预设库。通过增强虚拟训练场的多样性和真实感,团队希望构建一个用户社区,生成大规模数据集,为机器人学习更广泛的技能提供支持。
划重点: