在最新一期的《Release Notes》播客节目中,DeepMind的首席执行官德米斯·哈萨比斯深入探讨了公司的最新科研进展与长远规划。他提到,从AlphaGo这一游戏AI巨头,到如今更加先进的Deep Think,标志着DeepMind正稳步迈向通用人工智能(AGI)的领域。哈萨比斯强调,思考与规划能力是通往AGI不可或缺的一环,这一转变体现了从特定技能到全面智能的跨越。
哈萨比斯还透露,DeepMind的最终愿景是打造一款集语言理解、多媒体处理、物理推理及内容生成于一体的全能模型——Omni Model。他解释说,这一模型将集合DeepMind所有技术的精华,成为AGI的真正代表。
在谈及AI对物理世界的理解时,哈萨比斯提到了Genie 3这一项目。Genie 3能够构建出与现实世界高度一致的虚拟环境,这对于AGI在物理世界中的应用至关重要。然而,他也指出,当前AI系统虽在某些复杂任务上表现出色,但在面对简单任务时却可能失手,这种不一致性是阻碍AGI发展的关键因素之一。
哈萨比斯还强调了理解用户真实意图的重要性。他提到,未来的AGI系统必须能够解读用户的深层次需求,并将其转化为可优化的奖励机制。这一过程中,元认知或“元强化学习”的研究将发挥关键作用,帮助AI系统更好地理解并适应人类的需求。
在谈及AI系统的工具使用能力时,哈萨比斯表示,这是衡量AI智能水平的重要指标之一。一个真正的思考型系统,应该能够在思考过程中主动调用并利用工具。他透露,未来DeepMind的Genie、Veo、Gemini等模型将逐步融合,最终形成一个具备全方位能力的Omni Model。
哈萨比斯的分享不仅揭示了DeepMind在AGI领域的雄心壮志,也展示了该公司在推动人工智能技术进步方面的坚定决心。随着Omni Model的逐步成型,我们或许将见证一个更加智能、更加全面的AI时代的到来。