清华大学教授、智谱AI首席科学家唐杰近日通过社交媒体分享了他对2025年大模型技术发展的深度思考。他指出,当前大模型正从“理解世界”向“融入世界”转型,核心挑战已从提升智能水平转向如何将智能转化为实际生产力。这一观点引发了学术界和产业界的广泛关注。
在技术路径层面,唐杰认为预训练阶段虽未终结,但未来重点将转向中后训练环节。经过大规模预训练,大模型已掌握基础常识和推理能力,但标准化测试中的优异表现与真实场景应用仍存在差距。他特别强调激活对齐与推理增强的必要性:当前模型在数学奥赛等高难度任务中表现突出,却在简单任务中频繁出错,这反映出基准测试的局限性。现实场景中的长尾问题分布不均、边界模糊,要求模型具备更强的场景适应能力。
关于Agent技术的发展,唐杰提出关键性论断:Agent是大模型从认知系统向生产系统转变的里程碑。他比喻称,单纯预训练的大模型如同完成博士学业却缺乏实践能力的人,而Agent的介入使其真正进入现实世界。当前实现路径正从应用层编排向模型训练过程融合转变,但跨环境泛化仍是主要瓶颈。现有解决方案仍依赖海量环境数据和针对性强化学习,技术突破尚未出现根本性转变。
记忆机制被唐杰视为模型落地的重要支撑。他构建了人类记忆与模型能力的对应框架:短期记忆对应上下文窗口,中期记忆对应检索增强生成(RAG),长期记忆融入模型参数,人类历史知识则存储于公共知识库。当前技术方案试图通过扩展上下文长度和记忆压缩同时覆盖短期与中期记忆,但知识迭代与参数修改引发的灾难性遗忘问题仍未解决,这成为制约模型进化的核心难题。
在线学习与自我评估机制被预测为下一代技术范式。唐杰指出,现有离线训练模式存在资源浪费、交互数据丢失等缺陷,具备自学习能力的模型将成为必然趋势。这种进化依赖模型对自身判断的自我评估能力,即使仅能进行概率性判断,也可形成优化目标。该观点与OpenAI前联合创始人John Schulman、谷歌DeepMind首席执行官Demis Hassabis的论述形成呼应,后者曾强调持续在线学习是通往通用人工智能的关键缺失环节。
在应用层面,唐杰提出颠覆性观点:AI应用的核心不是创造新形态,而是替代或重构人类工作。他以聊天应用取代搜索引擎并融合情感交互为例,预测2026年将成为AI替代工种的爆发期。这种判断基于端到端发展趋势——随着模型能力增强,研发与应用将深度融合,无法创造实际价值的AI产品将失去生存空间。对于企业热衷的领域大模型,他直言这是AGI实现前的过渡方案,长期来看所有领域数据都将被通用主模型吸收。
针对多模态与具身智能,唐杰保持审慎态度。他认为多模态虽前景广阔,但当前对提升AGI上限作用有限,更现实的路径是文本、理解、生成分阶段推进并保持交叉探索。具身智能面临更严峻挑战:数据采集成本高昂、机器人本体稳定性不足,导致通用能力激活困难。不过他预测,随着数据规模扩大,2026年该领域将取得实质性突破。














