在最新一期的《Release Notes》播客节目中,DeepMind的首席执行官德米斯·哈萨比斯深入探讨了公司技术的最新进展及其长远规划。他提到,从AlphaGo在游戏领域的辉煌成就,到如今Deep Think向通用人工智能(AGI)迈进的尝试,这一历程彰显了AI从专门化向全面化发展的必然趋势。在哈萨比斯看来,具备思考与规划能力是通往AGI不可或缺的一环,而DeepMind的最终愿景,是打造一款集语言理解、多媒体处理、物理推理及内容生成于一体的全能模型——Omni Model。
节目中,哈萨比斯还介绍了DeepMind在物理世界理解方面的新进展,以Genie 3为例,该模型能够构建出逻辑自洽的虚拟世界,这对于AGI在现实环境中的操作与理解至关重要。然而,他也坦诚指出,当前AI系统在特定领域表现出色,但在面对简单任务时却可能栽跟头,这种不一致性正是阻碍其迈向AGI的关键因素。他进一步强调,未来的通用AI系统需具备理解用户真实意图的能力,并将这一理解转化为可优化的奖励机制,这背后涉及到元认知或“元强化学习”的深入研究。
哈萨比斯还特别提到了工具使用在AI系统能力构建中的重要性。他认为,一个真正的思考型系统,应当能够在思考过程中主动调用并利用各种工具。展望未来,他透露DeepMind旗下的Genie、Veo、Gemini等模型将逐步融合,最终进化为全能模型Omni Model,这将是AGI所应具备的综合能力的集大成者。