在北京通用人工智能研究院的展示大厅里,一个名为“通通”的虚拟小女孩正在数字空间中自主探索。这个能够“眼里有活”的智能体,不仅会主动整理房间、搭积木,还能在互动中理解人类价值观,其背后是通用人工智能领域的前沿突破。
“‘通通’是全球首个由价值与因果驱动的通用智能体,它的出现标志着人工智能研究从专用领域向通用能力的跨越。”北京大学人工智能研究院院长朱松纯指出,与传统专注于单一任务的垂域智能体不同,通用智能体具备自主感知、认知、决策、执行和社会协作能力,能够像人类一样理解任务目标并生成解决方案。
北京中关村学院院长刘铁岩用“多面手”形容这类智能体:“它不仅能开发程序、撰写报告,还能进行视觉设计,完成复杂且具有实际价值的任务。”这种能力的实现,关键在于为智能体构建更聪明的“大脑”。目前,学术界形成了两条技术路径:一是通过集成多个预训练模型实现功能“拼装”,类似搭积木般组合不同能力;二是将推理、规划等能力内化到基座模型中,通过整体训练使模型自主理解任务并执行操作。
为了让“通通”具备真实感知能力,研究团队采用了独特的交互方式——研究人员通过虚拟现实设备进入智能体的数字世界,扮演其家人或朋友。在这种高自由度的互动中,“通通”会主动要求搭积木、玩气球,甚至帮忙整理房间。这种实时交互对技术平台提出了极高要求,必须同时保证物理模拟的准确性和系统运行的实时性。
随着物理交互能力的完善,研究重心转向培养智能体的心智能力。在一个深夜的实验场景中,“通通”与扮演“妈妈”的研究人员互动时,主动拿起抹布擦拭溅到台面的水渍。这个细节不仅验证了物理模拟的精确性,更展现了通用智能体向具备常识和社会理解能力迈进的重要进展。
朱松纯透露,随着具身智能机器人技术的发展,未来的通用智能体将拥有“物理身体”,成为能够进入家庭、工厂、医疗等场景的智能助手。这项技术有望在智能制造、康复疗养、特种任务等领域发挥重要作用。
刘铁岩认为,通过提升自主学习能力、优化多任务协同效率、改进奖励函数设计等关键方向的突破,通用智能体的任务完成度将显著提高,同时研发成本会进一步降低。目前,研究团队正持续探索如何让智能体在复杂环境中更高效地理解人类意图并执行任务。