在最新一期《Release Notes》播客节目中,DeepMind的首席执行官德米斯·哈萨比斯揭示了公司技术领域的最新进展及长远规划。他分享道,从AlphaGo在游戏领域的辉煌成就,到如今Deep Think的推出,标志着DeepMind正稳步迈向通用人工智能(AGI)的广阔天地。这一旅程的核心,在于AI从特定技能向全面思考与规划能力的跃升。
哈萨比斯强调,DeepMind的最终愿景是打造一款集语言理解、多媒体处理、物理推理及内容生成于一体的全能模型——Omni Model。这一模型将不仅限于单一领域的卓越,而是全方位展现AGI的潜力。
在谈及AI对物理世界的理解时,哈萨比斯提到了Genie 3项目。该项目能够生成逻辑自洽的虚拟世界,这对于AGI在现实环境中的操作与理解至关重要。然而,他也指出当前AI系统存在的局限性:尽管在某些复杂任务上表现出色,但在简单任务上却可能失手,这种不一致性是通往AGI道路上的主要障碍。
为了克服这一挑战,哈萨比斯透露未来的通用AI系统需具备理解用户真实意图的能力,并能将这一理解转化为可优化的奖励机制。这一过程涉及到元认知或“元强化学习”的前沿研究,旨在使AI更加贴近人类的理解与决策模式。
哈萨比斯还着重强调了工具使用在AI发展中的重要性。他认为,一个真正的思考型系统应能在思考过程中主动调用并利用工具。展望未来,DeepMind的Genie、Veo、Gemini等模型将逐步融合,最终形成一个具备全能特性的Omni Model,这将是AGI综合能力的最佳体现。