比利时布鲁塞尔自由大学近日公布了一项在人工智能领域具有里程碑意义的研究成果:商用大型语言模型已具备独立推导原创数学证明的能力。实验中,OpenAI研发的ChatGPT-5.2(Thinking)成功攻克了数学家Ran与Teng于2024年提出的未解数学猜想,这一突破性进展引发了科学界的广泛关注。
该研究团队将这一新型科研模式命名为“氛围证明”(vibe-proving),其概念源于近年来兴起的“氛围编程”理念。与传统数学证明依赖人类数学家逐步推导不同,ChatGPT在证明过程中完全自主完成了逻辑路径的探索与核心框架的构建。通过7轮对话交互与4次自我迭代优化,AI最终形成了严密的数学论证体系,仅需人类研究者进行最终校验。
数学界对这一成果反应热烈。专家指出,该研究首次证明大型语言模型不仅具备数据归纳能力,更能进行创造性逻辑推理。布鲁塞尔自由大学教授Vincent Ginis强调,这项发现彻底颠覆了“AI缺乏原创思维”的传统认知,标志着人工智能正式进入需要高度抽象思维的理论数学领域。
随着AI证明生成技术的成熟,数学研究范式正面临深刻变革。传统研究中“寻找证明路径”的瓶颈问题将逐步被“逻辑正确性验证”所取代。当AI能够批量生成高质量数学证明时,如何建立自动化验证系统将成为新的技术竞争焦点。研究团队预测,未来数学家的核心工作可能转向设计更高效的验证算法,而非直接参与证明推导过程。
这项突破也引发了关于科研主体性的讨论。尽管当前AI仍需人类进行最终验证,但其推演效率已远超传统方法。实验数据显示,ChatGPT在48小时内完成的证明推导,相当于人类数学家数月的工作量。这种效率差距正在迫使科学界重新思考人机协作的边界与模式。













