数学界近日因一场非同寻常的实验陷入热议:菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)通过测试ChatGPT 5.5 Pro,发现该人工智能系统在未获得任何数学指导的情况下,仅用不到两小时便独立完成了一项具有博士论文水准的数学证明。这一成果令学界震惊,因其意味着人类数学家在特定研究场景中的智力贡献可能趋近于零。
实验始于高尔斯从数学家梅尔文·纳撒尼尔森(Melvyn Nathanson)的新论文中选取的几个未解问题。这些问题聚焦于加法数论中集合求和的复杂性:给定包含k个整数的集合A,其h重求和集hA的可能规模范围是什么?若要实现特定规模的求和集,集合的“直径”最小值该如何确定?纳撒尼尔森此前为其中一个问题提供了指数级上界(2^k - 1),而高尔斯将该问题输入ChatGPT后,AI在17分5秒内给出了二次方级构造,直接将上界优化至最优水平。
更引发争议的是高尔斯在实验中的角色。他明确表示,自己未提供任何数学思路、关键引理或证明方向,仅通过简单提示词引导AI,例如“这个思路不错,试试看能否成立”或“将推导过程整理为标准LaTeX格式”。所有推理步骤、构造方法与关键转折均由AI独立完成,而人类数学家仅承担了“情绪支持”与“格式校对”的辅助性工作。
当高尔斯进一步追问更复杂的通用情况(即任意h值下的求和集规模)时,ChatGPT展现了更惊人的能力。针对麻省理工学院博士生艾萨克·拉贾戈帕尔(Isaac Rajagopal)此前证明的指数级上界,AI在首轮思考中将结果优化至k^(1/2+ε)的指数级,随后在高尔斯提出“能否降至多项式级”的挑战后,AI通过13分33秒的分析提出可行性方案,并在验证两个技术命题后,用31分40秒撰写出完整预印本论文。最终成果将上界从指数级压缩至O(k^{10h³})的多项式级,其核心创新——利用h²-耗散集控制低阶关系——被拉贾戈帕尔评价为“完全原创且巧妙”。这位博士生坦言,自己完成类似脑力风暴需一至两周,而AI仅用不到一小时。
实验的冲击波迅速蔓延至学术生态层面。高尔斯指出,组合数学领域长期存在一种研究模式:学者提出新组合参数并附带未解问题,为初入科研的学生提供可攻克的“入门级”目标。然而,AI的介入正在颠覆这一传统。“过去,提出一个问题就足以支撑研究,”高尔斯在博客中写道,“但现在,问题必须足够困难,难到大型语言模型无法解决。”据统计,2026年以来已有15个由数学家保罗·厄多斯(Paul Erdős)提出的开放问题被破解,其中11项明确标注了AI的贡献。就在数周前,23岁、无高等数学学位的利亚姆·普赖斯(Liam Price)使用GPT-5.4 Pro在80分钟内攻克了一道困扰学界60年的厄多斯难题,其证明经菲尔兹奖得主陶哲轩验证后,更被拓展为新理论的起点。
学界对这一趋势的反应呈现两极分化。部分研究者认为,AI的数学能力已进入不可逆的加速通道:从2023年GPT-4无法解决多数本科数学题,到2024年o1模型在数学竞赛中达到金牌水平,再到2025年o3模型展现前沿研究推理能力,直至2026年GPT-5.5 Pro独立完成博士级证明,AI仅用三年便跨越了从本科到博士的研究门槛。OpenAI研究员塞巴斯蒂安·布贝克(Sebastien Bubeck)对此表示认同,认为学术界正面临“范式转移”。但也有学者强调,高尔斯的实验虽具有指标性意义,但纳撒尼尔森的问题未必代表数学研究的前沿天花板,需谨慎对待单一案例的外推结论。
无论争议如何,一个事实已无法回避:在特定数学问题上,AI正从“辅助工具”蜕变为“独立研究者”。当曾经需要数年训练才能触及的研究门槛被技术消解,学术生态的深层变革或许已悄然启幕。











