在全球科技巨头纷纷加码大语言模型(LLM)的浪潮中,图灵奖得主、meta首席AI科学家Yann LeCun却选择了一条截然不同的道路。这位被誉为“AI教父”的学者宣布,将于年底结束在meta长达12年的任职,转而投身创业,致力于开发能够理解物理世界的机器智能系统。
LeCun的离职并非突然之举。早在数月前,他便多次公开质疑LLM的技术路线,认为这类基于文本生成的模型虽在语言处理领域表现卓越,却缺乏对真实世界的认知能力。他指出,当前AI系统在记忆存储、多步推理等方面存在明显短板,仅靠扩大模型规模无法实现真正的通用人工智能(AGI)。
在巴黎举办的AI-Pulse活动上,LeCun进一步阐述了他的技术愿景。他强调,自主机器智能需要建立在“世界模型”基础之上——这种模型通过视觉等感官信息训练,能够预测物理世界的演变规律。与之形成对比的是,LLM更像是“文本生成器”,属于快速反应的System 1系统,而非具备深度推理能力的System 2系统。
这位学者对技术路线的坚持,与meta的战略方向产生了显著分歧。尽管公司CEO马克·扎克伯格曾公开表示支持,但实际行动却颇为谨慎。LeCun透露,meta并未参与其新创业项目的投资,双方在技术路径上的分歧已难以调和。这种矛盾在meta近期重金招募LLM专家的举措中体现得尤为明显——公司不惜代价从竞争对手处挖角,甚至由扎克伯格亲自出面挽留人才。
LeCun的技术理念可追溯至十年前。他长期主张,真正的机器智能应当模仿人类婴儿的学习方式:通过观察和互动构建对世界的认知模型。为此,他带领团队开发了非生成式的联合嵌入预测架构(JEPA),这种系统能够学习现实世界的结构特征,并预测不同行动可能产生的结果。相较于依赖自回归机制的LLM,JEPA架构更接近人类认知世界的模式。
在具体实践层面,LeCun的团队不仅使用视频数据,还引入电子游戏等交互式场景进行模型训练。他解释称,单纯依赖视频数据存在局限性——就像观看梦境般缺乏参与感,而真正的智能需要具备预测不同行动后果的能力。这种思路与当前主流的“视频模型”形成鲜明对比,体现了其对交互式学习的高度重视。
这位学者的技术主张引发了行业广泛讨论。支持者认为,他指出了当前AI发展的瓶颈;反对者则质疑,放弃已被验证的LLM路线是否明智。市场对此反应敏感:在LeCun离职消息传出后,meta股价短暂下跌2%,反映出投资者对公司技术方向调整的担忧。










