字节跳动旗下Seed团队近日宣布,其研发的新一代形式化数学推理模型Seed Prover 1.5已正式亮相。这款模型通过大规模智能体强化学习技术训练,在数学竞赛题的自动化证明领域展现出显著进步,尤其在处理复杂数学命题的严谨推导方面取得突破。
在严格的测试环境中,该模型在国际数学奥林匹克竞赛(IMO)2025预选题的5道题目中,仅用16.5小时便生成了符合Lean证明系统标准的完整代码,其得分表现达到该赛事历史金牌分数线。另一项针对美国大学生数学竞赛(Putnam)2025年赛题的测试显示,模型在9小时内完成了12道题目中的11道可验证证明,在Putnam历史题库中的整体解决率达到88%。这些数据表明,模型在限定场景下的数学推理能力已接近人类顶尖水平。
研发团队特别指出,当前版本仍聚焦于"边界明确、规则完备"的竞赛类数学问题。对于需要跨领域知识整合、长逻辑链推导的前沿数学研究,模型尚无法完全替代人类专家的文献分析能力和创造性思维。团队同步公开了完整技术报告,并计划在未来开放API接口,供全球数学研究者测试其在实际科研场景中的应用潜力。
据技术文档披露,该模型通过构建多智能体协作框架,模拟数学家解题时的分工模式,在证明生成过程中自动分配定理验证、反例排查等子任务。这种设计使其在处理组合数学、数论等结构化较强的领域时效率显著提升,但在涉及几何直观或物理类比的问题上仍存在局限。






