数学界迎来一场意外突破:OpenAI最新模型GPT-5.2 Pro成功独立完成埃尔德什问题库第281号猜想证明,经菲尔兹奖得主陶哲轩验证后被认定为"AI主导的首类重大成果"。这道由传奇数学家保罗·埃尔德什与罗纳德·格雷厄姆于1980年提出的组合数学难题,在沉寂45年后被人工智能攻克,引发学界对数学研究范式的深度讨论。
研究团队披露,整个论证过程完全依托GPT-5.2 Pro的自主推理能力完成。模型在无穷阿德尔整数环框架下,通过哈尔测度与点态遍历定理构建核心逻辑链,最终利用紧致性论证实现从逐点收敛到一致收敛的关键跃迁。陶哲轩特别指出,该证明可视为遍历理论与组合数学交叉领域"Furstenberg对应原理"的创新变体,但AI在伯克霍夫定理的应用上展现出超越传统方法的独特路径。
验证过程中出现戏剧性转折。数学爱好者KoishiChan在社区讨论中指出,这道难题的解答可能早已存在于经典文献中——1936年达文波特与埃尔德什合作的密度收敛定理,结合1966年罗杰斯定理的组合应用,理论上可直接推导出结论。这一发现引发连锁反应:法国数学家特南鲍姆确认经典路径的有效性,同时揭示罗杰斯定理因仅收录于哈尔伯斯塔姆-罗斯专著而长期被忽视的学术现状。
双重证明体系的浮现引发对数学发现本质的反思。陶哲轩团队通过对比发现,AI路径与经典文献路径虽在概念层面存在交叉,但具体论证结构具有本质差异。特别值得注意的是,GPT-5.2 Pro在极限交换与量词顺序等易错环节展现出惊人准确性,有效规避了前代模型常见的逻辑漏洞。为确保严谨性,陶哲轩亲自将遍历论论证转换为组合学语言,通过哈代-利特尔伍德极大不等式重构推导过程,最终确认两种方法殊途同归。
这场数学突破同时暴露出AI研究工具的评估困境。交叉验证显示,Gemini 3 Pro等模型均认可证明有效性,但陶哲轩提醒注意"报告偏差"现象:负面结果因缺乏传播动力往往被隐藏,导致成功率的统计失真。开源项目数据显示,前沿大语言模型在埃尔德什问题库中的实际成功率仅1%-2%,尽管600余道未解难题的规模意味着仍可能产生可观贡献。
学术界对AI数学能力的认知正在经历微妙转变。特南鲍姆指出,罗杰斯定理的"沉睡"案例折射出数学文献传播的固有缺陷,而AI的介入可能加速冷门定理的重发现过程。陶哲轩则强调,当前AI更擅长处理中等复杂度问题中的特定模块,距离系统性突破仍有差距。这场意外突破或许预示着数学研究新时代的开端——人类数学家与人工智能正在共同绘制未知领域的认知地图。











