当菲尔兹奖得主蒂莫西·高尔斯将加法数论领域的公开难题抛给ChatGPT 5.5 Pro时,这场实验的走向彻底颠覆了数学研究的传统认知。这位剑桥大学教授仅用两小时便见证了人工智能独立推导出足以写入博士论文的数学成果,而整个过程中他仅需扮演"项目管理者"角色——确认研究方向、要求成果输出格式。这场意外发现,正在数学界引发关于学术体系存续危机的深度讨论。
实验的核心问题源自数学家梅尔·纳撒尼尔森的论文:给定整数集合的元素数量及其二重求和集规模,如何确定该集合的最小直径?面对这个困扰学界多年的难题,ChatGPT通过组合Sidon集与等差数列的创新构造,将原本指数级的上界优化至二次方级别。更令人震惊的是,当高尔斯进一步追问k重求和集的直径问题时,AI不仅改进了麻省理工学院学生的研究成果,更独创出k-解离集合构造法,其论证逻辑获得原研究者的认可。
这场人机协作的数学实践暴露出学术体系的深层矛盾。传统博士生培养模式中,入门级公开问题被视为重要的科研训练载体,但AI的介入正在重塑这个生态。高尔斯指出,当人工智能能在两小时内解决原本需要数年研究的课题时,学术发表的规则与人才培养的路径都面临根本性挑战。目前该成果仅能以博客链接形式存在,因主流学术平台尚未建立AI生成内容的审核机制。
面对技术冲击,数学界呈现出两种应对思路。高尔斯提出"人机协作"的缓冲方案:未来科研竞争将聚焦于人类引导AI产生突破性想法的能力,而非单纯解出AI无法完成的难题。他同时指出,组合数学领域因依赖反向推理,短期内仍将是人类的优势领域,但这种判断可能随技术迭代迅速失效。更尖锐的质疑在于,当数学家仅作为AI对话者参与重大研究时,定理冠名权是否还具有学术价值。
菲尔兹奖得主陶哲轩则从认知维度提出解决方案。他将数学研究拆解为证明生成、验证与消化三个层次,指出前两者虽已被AI快速渗透,但"证明消化"——理解论证背后的深层结构与创新价值——仍是人类不可替代的领域。这位AI4S组织创始人警告,过度追求技术优化可能导致"证明消化不良"危机,当机器生成的海量证明缺乏人类理解时,数学研究将沦为数据堆砌。
两位顶尖数学家的思考折射出技术革命下的范式转变。高尔斯看到的危机本质是学术评价体系的瓦解:当AI能独立完成从问题解析到论文撰写的全流程时,传统以个人署名为核心的学术认可机制将失去意义。而陶哲轩强调的"自然难度"概念,则指向人类在智能时代保持主体性的关键——那些需要反复咀嚼、痛苦探索才能内化的知识,恰是维持认知深度的最后防线。这场关于数学研究本质的讨论,正在重新定义人类智能的边界。











