近日,AI领域掀起一场关于技术路线的激烈讨论,焦点人物正是被誉为“AI教父”的图灵奖得主杨立昆。这位meta首席AI科学家被曝正在筹备离职创业,其目标直指当前硅谷主流的大语言模型(LLM),转而推动一种全新的“世界模型”架构。这一举动被业界视为对现有AI发展路径的重大挑战,甚至可能引发行业格局的深刻变革。
杨立昆长期主张的“世界模型”与传统LLM形成鲜明对比。他指出,当前主流的LLM如同“文字专家”,通过海量文本数据训练,擅长语言生成与模式识别,却缺乏对物理世界的真实理解。例如,当被要求想象一个立方体旋转90度后的形态时,LLM因缺乏空间推理能力而无法完成。相比之下,杨立昆设想的“世界模型”将通过图像、视频和空间数据感知环境,不仅能够实时估计世界状态,还能预测动作后的因果结果,从而赋予AI真正的规划与推理能力。
“我家那只猫的智能都远超现有LLM。”杨立昆曾用这句尖锐的比喻,直指当前技术路线在常识与因果理解上的短板。他强调,动物通过观察与行动迅速构建因果模型,而LLM仅依赖统计关联,无法形成对世界的深层认知。在他看来,无限扩展算力与数据只会让LLM成为“记忆力超群的复读机”,而非通往通用人工智能(AGI)的桥梁。
这场理念之争的背后,是杨立昆与meta战略方向的深刻分歧。随着公司全面转向LLM开发,这位65岁的科学家逐渐被边缘化。2018年,他卸任管理职务,转任“个体贡献者”,不再参与核心项目如开源大模型Llama的研发。今年夏天,年仅28岁的Scale AI创始人汪滔被任命为meta首席AI官,直接成为杨立昆的上级,而另一位年轻科学家赵晟佳的加入,进一步加剧了权力结构的变动。AI部门裁员与资源缩减的消息,也加速了杨立昆的离场决心。
杨立昆的职业生涯始终充满“叛逆”色彩。早在机器学习尚属冷门领域时,他便将其作为博士研究方向;在贝尔实验室期间,他参与开发了银行广泛使用的手写识别技术;2013年,受扎克伯格邀请,他领导meta基础AI研究实验室(FAIR),并于2018年与杰弗里·辛顿、约书亚·本吉奥共同斩获图灵奖。如今,他再次以“孤独先知”的姿态,挑战行业共识,试图为AI发展开辟新路径。
值得注意的是,杨立昆的探索并非孤立无援。AI领域另一位顶尖学者、ImageNet创造者李飞飞,近期也通过新公司World Labs推出模型Marble,该模型能够理解并生成3D环境,与“世界模型”理念不谋而合。李飞飞曾公开表示,未来需超越Transformer架构探索新模型,这与杨立昆的呼吁形成呼应。两位权威学者的共识,或许预示着AI行业即将从LLM的“狂欢”中抽身,转向更深层次的范式革新。
杨立昆的创业计划尚未公布具体细节,但已引发广泛关注。支持者认为,他的“世界模型”可能破解当前AI在物理世界交互中的瓶颈;质疑者则担忧,这一路线是否具备技术可行性,或是否会因过于超前而难以落地。无论如何,这场由“AI教父”发起的挑战,已为行业注入新的变量,其结果或将重新定义人工智能的未来方向。

















