卡帕西对当前业界热议的“智能体元年”概念提出冷静判断。他指出,尽管Claude、Codex等工具已展现出实用价值,但现有智能体仍存在认知缺陷,缺乏持续学习能力,且无法自主操作复杂系统。基于十五年行业经验,他预测智能体技术需要至少十年持续研究才能实现真正可用性,未来十年将是“智能体的十年”。
关于AGI实现时间,卡帕西结合技术发展规律给出十年预测。他观察到行业存在过早追求完整智能体的倾向,而忽视了基础技术栈的完善。通过复现1989年卷积神经网络实验,他发现算法改进虽能提升性能,但数据规模、计算能力和软件系统的协同发展同样关键,这种多要素协同模式将持续影响AGI进程。
在AI架构演进方面,卡帕西认为未来十年核心机制仍将围绕神经网络展开。他以“时间平移不变性”理论解释技术迭代规律:从卷积网络到Transformer的演进,本质都是前向传播与梯度下降的变体。尽管具体形态可能变化,但超大模型的训练范式和核心机制将保持延续性。
针对大模型认知局限,卡帕西以自身开发nanochat的经历为例,指出当前模型在处理复杂编码任务时仍显不足。他将开发者与代码的交互模式分为三类:完全手写、手写配合自动补全、完全依赖智能体生成。实验表明,在需要深度思考的场景中,第二类模式仍是最优选择,这反映出模型在处理“智力密集型任务”时的根本性局限。
在AI学习机制讨论中,卡帕西对比了强化学习与传统监督学习的差异。他承认强化学习存在奖励分配困难、对抗样本脆弱等问题,但强调其相比单纯模仿人类行为具有突破性。针对模型自我评估的不可靠性,他提出需要引入元学习或合成数据机制,不过目前尚未有实验室实现通用环境下的有效应用。
对于人类与AI的学习差异,卡帕西以梦境为例,指出人类通过反思、讨论等多元方式整合知识,而当前模型仅依赖预测下一个词的学习方式存在本质缺陷。他特别提到互联网训练数据的噪声问题,认为真正重要的智能发展在于认知能力而非记忆容量,这解释了为何构建超大模型压缩记忆并非最优路径。
在AI社会影响层面,卡帕西以医疗影像诊断为例,指出即便计算机视觉技术成熟,放射科医生的工作仍包含患者沟通等复杂场景。他提出更现实的AI应用模式是完成80%常规工作,剩余20%关键任务交由人类监督。这种人机协作模式,在呼叫中心等场景已显现出可行性。
关于超级智能(ASI),卡帕西将其视为自动化进程的自然延伸。他警告当世界运行依赖于计算机集群时,人类可能逐渐丧失对系统的理解能力。不过他同时指出,这种递归式自我改进从工业革命开始已持续数百年,所谓“智能爆炸”本质上是自动化程度的持续深化。