在国际人工智能研究领域,一项来自中国的突破性成果引发广泛关注。由北京通用人工智能研究院联合北京大学多院系科研团队开发的“通矩模型”,近日在国际权威学术期刊《自然-机器智能》发表。该系统首次实现自主命题与自动解题的双重能力,在自动化推理领域达到国际领先水平,标志着我国在通用人工智能核心技术研发上取得重要进展。
几何推理作为人工智能发展的关键瓶颈,长期面临两大挑战:一是搜索空间呈指数级增长的“组合爆炸”问题,二是训练数据规模受限的困境。传统AI系统在处理复杂几何命题时,往往因辅助线添加策略失效而陷入无效计算,而现有几何题库的有限性更制约了模型训练效果。针对这些难题,研究团队构建了全新的逻辑推理架构,通过抽象化建模将几何问题转化为可系统探索的数学空间。
该模型的核心创新在于引入“规范化表示”技术,赋予系统识别几何图形本质特征的能力。无论三角形如何旋转、缩放或翻转,系统都能穿透表象差异,精准捕捉其内在几何关系。这种对物理对称性的深度利用,使搜索空间压缩了数个数量级。研究显示,在处理国际数学奥林匹克竞赛几何题时,模型仅需单张消费级显卡即可在38分钟内完成解题,其效率与准确率均达到国际先进水平。
更引人注目的是,系统通过强化学习技术模拟人类数学审美,构建了独特的“价值模型”。该模型不仅能判断推理结论的正确性,更能评估推导过程的简洁性。当发现命题证明难度显著高于构建复杂度时,系统即判定其具有“数学美感”,从而筛选出符合人类认知标准的高质量题目。这种价值引导机制使模型突破了传统“模仿解题”模式,首次实现从被动训练到主动创造的范式转变。
研究团队负责人介绍,通矩模型已展现出强大的原创能力。其自主设计的3道几何新题被纳入2024年全国中学生数学联赛北京赛区试题库,验证了系统在科学规律发现方面的潜力。与传统数据驱动型AI不同,该模型通过内部逻辑演化实现能力提升,为“小数据、大任务”的研究路径提供了新范式。这种不依赖海量标注数据的技术路线,被认为更接近通用人工智能的发展本质。
目前,该成果已在数学教育领域展开应用探索。系统可根据学习者水平定制个性化训练方案,提供智能化的解题指导。随着模型持续优化,研究团队正尝试将其扩展至物理、化学等基础学科,为科学大模型开发奠定技术基础。这项突破不仅提升了我国在人工智能核心领域的国际话语权,更为复杂逻辑系统的自动化推理提供了全新解决方案。












