ITBear旗下自媒体矩阵:

杨立昆“唱反调”:大语言模型非AGI正途,JEPA世界模型或成破局关键

   时间:2026-05-04 15:32:29 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在人工智能领域,关于大语言模型(LLM)能否实现通用人工智能(AGI)的争论从未停歇。深度学习先驱杨立昆近期在科技频道Welch Labs的访谈中,系统阐述了他对这一问题的看法,并详细介绍了基于联合嵌入预测架构(JEPA)的世界模型技术路径。

杨立昆认为,当前主流的生成式大语言模型存在根本性缺陷。这类模型通过自回归机制预测下一个字符或像素,本质上是在复现训练数据中的统计规律,而非真正理解物理世界的运行逻辑。随着输出序列延长,误差会不断累积,导致结果偏离客观事实。他强调,单纯扩大模型规模无法解决这一结构性问题,因为概率统计无法转化为因果推理能力。

针对LLM的局限性,杨立昆提出了替代方案——世界模型。该模型通过构建抽象表征空间进行预测,而非直接生成像素级内容。其核心优势在于能够模拟物理规律,使AI系统在执行任务前预判不同行动的后果。这种基于客观规律的内部推演能力,被视为实现AGI的必要条件。

JEPA架构是世界模型的具体实现形式。与传统生成式模型不同,JEPA通过编码器将输入数据压缩为数学表征,再由预测器基于当前状态推断未来状态。这种设计避免了像素级预测的计算负担,使模型能够专注于分析场景中的关键特征。例如,在视频预测任务中,JEPA会忽略树叶摆动等随机噪声,转而关注物体运动轨迹等核心规律。

解决表征坍塌问题是JEPA技术突破的关键。早期联合嵌入架构容易陷入平凡解,即对所有输入输出相同表征。为克服这一难题,杨立昆团队引入了Barlow Twins方法,通过最大化不同特征间的信息差异,迫使模型学习真实有效的环境信息。实验表明,采用该技术的自监督学习模型在ImageNet分类任务中达到73.2%的准确率,超越了全监督的AlexNet。

世界模型的应用潜力已在机器人领域得到验证。通过V-JEPA等变体模型,机械臂能够在不依赖人工标注数据的情况下,理解物体间的相互作用关系。当给定目标状态图像时,系统可基于世界模型预演不同动作序列,最终生成最优操作路径。这种能力使机器人能够完成复杂任务,同时确保行动安全性。

杨立昆指出,世界模型与LLM并非完全对立,但前者代表更接近AGI的发展方向。他批评当前部分AI系统缺乏行为后果预测能力,认为这是构建安全可靠智能体的重大隐患。通过JEPA架构,AI系统能够将推理转化为严密的搜索推演过程,而非简单的自回归预测,这为实现自主机器智能开辟了新路径。

尽管世界模型已取得阶段性成果,但其大规模应用仍面临挑战。杨立昆团队正致力于优化表征学习技术,以提升模型对复杂场景的理解能力。随着相关研究的深入,基于JEPA的世界模型有望在自动驾驶、工业自动化等领域引发变革,推动AI向更高层次的智能迈进。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version