比利时布鲁塞尔自由大学数据分析实验室近日公布了一项突破性研究:商用大型语言模型已具备独立生成原创数学证明的能力。这项成果标志着人工智能在理论数学领域的探索迈出关键一步,相关预印本论文已于2026年2月21日上传至arXiv平台。
研究团队以数学家Ran与Teng于2024年提出的未解数学猜想为突破口,通过与OpenAI旗下ChatGPT-5.2(Thinking)进行7轮交互对话,最终完成证明。该猜想作为数学领域典型命题,此前虽通过规律验证被广泛认可,但始终缺乏严谨的形式化论证。研究过程中,AI系统逐步迭代出4个论证版本,在证明路径探索与核心结构搭建方面发挥主导作用,人类专家则负责把控逻辑完整性与最终验证。
这项研究催生了名为"vibe-proving"的新型AI推理方法。该方法借鉴了AI辅助编程(vibe-coding)的发展路径,通过大模型梳理复杂理论框架,实现从基础工具向半自动化理论探索的跨越。研究负责人Vincent Ginis教授指出:"传统观点认为AI创造力仅限于训练数据重组,我们的实践证明机器学习系统能够突破这种局限。"
参与研究的Brecht Verbeken博士后透露,虽然团队预期AI能提升证明效率,但实际表现远超预期。在最终论证版本中,ChatGPT不仅完成了80%的推理步骤,还自主修正了3处逻辑漏洞。不过研究人员强调,人类专家在补全证明缺口、构建严密论证链等环节仍不可替代,特别是在处理需要数学直觉的抽象概念时。
随着AI生成候选证明的速度大幅提升,数学研究领域正面临新挑战。Andres Algaba教授分析称,未来验证环节将成为主要瓶颈,而语言模型在辅助校验方面同样具有应用潜力。这项成果已引发学界广泛关注,多所顶尖高校正筹备开展类似研究,探索AI在数论、拓扑学等领域的可能性。
从辅助编程到文本创作,再到理论数学研究,大语言模型的能力边界持续拓展。此次突破不仅改写了人工智能的应用版图,更为解决困扰数学界数十年的重大猜想提供了新范式。随着人机协作模式的深化,数学研究或将进入"AI提议-人类验证"的新纪元。











