在近期举办的智能未来行业峰会上,清华大学人工智能研究院常务副院长孙茂松就生成式人工智能与大模型的发展态势发表深度见解。这场汇聚近三十位产业代表的盛会吸引线下观众近1500人,线上直播观看量突破350万次,引发主流媒体广泛关注。
自2017年深度学习进入预训练模型时代以来,人工智能领域仅用八年时间便完成数次技术跃迁。从2020年GPT-3的发布到ChatGPT的广泛应用,再到近期国产大模型的崛起,技术迭代速度远超预期。孙茂松特别指出,大模型最引人入胜的特性在于其非线性发展规律——当模型参数突破临界点时,性能提升往往呈现指数级增长,这种不可预测性既带来机遇也暗藏风险。
当前人工智能发展已形成显著优势领域。在标准化学术测试方面,顶尖模型在"人类终极考试"中取得三四十分,远超人类专家的平均水平。代码生成领域更出现颠覆性突破,今年国际大学生程序设计竞赛中,人类冠军团队已不敌大模型选手。多模态交互能力的突破,为人工智能从文本世界向物理世界延伸奠定基础。
技术突破背后潜藏着深层挑战。孙茂松引用控制论创始人维纳的观点强调,真正的智能必须具备环境感知与交互能力。当前语言模型虽在"言说"层面接近通过图灵测试,但在"认知"维度仍存在根本性缺陷。他形象比喻道:"现有模型掌握七八成知识,却缺乏体系化理解,如同背熟百科全书却不知如何运用。"这种"知行断层"成为制约具身智能发展的关键瓶颈。
行业面临的现实困境在资本层面尤为突出。法国《回声报》披露,OpenAI计划将计算能力提升至250GW,相当于250个核反应堆的发电量,预计投资规模达10万亿美元。这种激进扩张策略引发华尔街担忧,暴露出技术路线的不确定性。孙茂松分析指出,任何技术系统发展到特定阶段都会遭遇性能饱和,当前大模型依赖的扩展法则可能面临失效风险。
具身智能发展路径引发学界热议。针对空间智能理论,孙茂松提出关键质疑:基于文本预测的Next Token机制能否适用于四维物理世界?他以图像识别为例说明,3×3像素块可能对应衣物补丁、桌面一角或屏幕图标,语义不确定性远超文本序列。这种复杂性使得人形机器人在开放环境执行复杂任务的前景堪忧,图灵奖得主Hinton关于AI就业影响的论述从侧面印证了这一判断。
面对技术发展的不确定性,孙茂松提出差异化竞争策略。他借用"致广大而尽精微"的古训,建议国内产业布局采取双轨并行模式:少数顶尖团队持续追踪国际前沿技术,多数企业应深耕垂直领域应用。以国产开源模型为基础的产业融合已显现优势,在智能制造、医疗诊断等场景中,针对性优化往往能催生创新算法。这种"精微"之路不仅风险可控,更可能反向推动基础理论突破。
这场思想交锋为行业指明务实方向。与会专家普遍认同,在算力竞赛日趋白热化的背景下,聚焦特定场景的深度开发既是现实选择,也是突破技术瓶颈的有效路径。正如孙茂松所言:"垂直领域的精耕细作,或许能孕育出改变游戏规则的颠覆性创新。"这种战略定力,或将决定中国人工智能产业的未来走向。











