知名数学家陶哲轩近日在数学研究领域完成了一项突破性实践——他借助ChatGPT的协助,成功攻克了MathOverflow平台上的一道复杂难题。这一成果不仅验证了人工智能在数学研究中的实用性,更展现了人机协作在科研领域的创新可能。
该问题聚焦于数论领域,核心在于验证"最小公倍数序列lcm(1,2,…,n)是否属于高度丰数集合的子集"。陶哲轩通过理论推导已初步判定答案为否定,但需要构建具体数值反例来完成严谨证明。这项工作涉及大量参数搜索与计算验证,传统方法需耗费数小时进行编程调试。
在初期尝试中,陶哲轩让AI直接生成Python代码进行参数搜索。然而生成的代码存在运行效率低下、初始参数设置不合理等问题,导致搜索过程屡次受挫。面对这一困境,数学家调整策略,采用分步交互模式与AI展开协作:他将复杂问题拆解为多个计算步骤,每阶段由AI提供计算支持,并在人工指导下持续优化参数选择。
经过长达一小时的密集对话,AI最终生成了符合要求的数值参数。为确保结果准确性,陶哲轩使用AI生成的29行Python脚本进行独立验证,脚本的简洁性与验证结果的一致性令人信服。这种协作模式显著提升了研究效率,将原本需要数小时的编程调试工作压缩为高效流程。
OpenAI团队对这一成果表示高度关注。副总裁Kevin Weil在社交平台特别强调"陶哲轩与AI组合攻克数学难题"的突破性意义,科学家Sebastien Bubeck则指出这是数学家本人直接参与的典型案例。值得关注的是,此次使用的GPT-5模型近期刚完成三大数学猜想的验证,其表现远超人类博士生数日的工作量。
在技术实现层面,陶哲轩特别指出AI未出现常见的"幻觉"问题。这得益于其清晰的任务规划与渐进式引导策略:每项计算任务都在人工监督下完成,AI仅在最终阶段提供数值结果与验证代码。数学家将这种成功归因于"对计算任务有明确规划,并能以分步方式向AI清晰传达指令"的工作模式。
此次实践揭示了AI在数学研究中的独特价值。通过承担繁琐的计算任务,AI使研究者得以专注于更高层次的思维活动。正如陶哲轩所言,若没有AI协助,他可能不会尝试这种数值搜索方法,而是转向传统理论分析路径。这种协作模式不仅优化了工作流程,更开创了数学研究的新范式。
随着GPT-5等先进模型在数学竞赛中斩获金牌,并在科研领域展现实用价值,人机协作的研究模式正引发学术界广泛关注。此次突破标志着AI已从单纯的计算工具,进化为能够参与复杂探索过程的智能伙伴,这种转变或将重塑多个学科领域的研究方法。