AI 数学封神华人团队打造 AI 狂刷 Putnam 竞赛解题思路颠覆认知

华人团队 AxiomProver 打造的 AI 在 Putnam 数学竞赛中取得满分,展现了 AI 在数学领域的强大能力。AI 的解题思路与人类迥异,甚至能以出人意料的方式解决难题。未来,人机协作将成为数学研究的新范式,共同推动数学领域的进步。通用人工智能在数学领域的奇点已至。
AI 数学封神华人团队打造 AI 狂刷 Putnam 竞赛解题思路颠覆认知

一个AI不仅能解开大学本科生最难的数学竞赛题,而且解题思路还和人类完全不同,甚至更为巧妙。这不是科幻小说,而是正在发生的现实。由华人团队开发的AxiomProver AI系统,在2025年Putnam数学竞赛中,创造了"AI封神"的奇迹。

Putnam竞赛:本科生数学的珠穆朗玛峰

Putnam数学竞赛被誉为北美本科生数学竞赛的"天花板",其难度之高让无数数学爱好者望而却步。竞赛要求参赛者在短短6小时内解决12道极具挑战性的证明题,总分120分。对人类选手而言,接近满分几乎是不可能完成的任务。历年来,只有最顶尖的选手(Putnam Fellows)才有机会冲击110分以上。

AxiomProver:AI界的"解题机器"

然而,AxiomProver却打破了这个"神话",以满分的成绩傲视群雄。更令人惊叹的是,AxiomMathAI官方博客还公开了全部Lean形式化证明,相当于将AI的解题思路完全透明化,供学界研究学习。

AI的解题"脑回路":与人类大不同

AxiomProver团队将题目按照AI与人类认知差异分为三类:

  • 人类直觉简单但形式化极为繁琐的问题: 这类题目对人类可能只需灵光一闪,但对AI却需要极其繁琐的步骤。
  • AI出人意料攻克的人类未预期可解问题: AI的解法往往出人意料,甚至颠覆人类认知。
  • 采用不同数学路径解决的问题: 即使同一道题,AI和人类的解题思路也可能完全不同。

团队指出,未来理想的研究范式将是"人类提供灵感,机器负责形式化验证与落地",甚至辅助抽象概念的生成与选择。这种人机协作模式或将彻底改变数学研究方式。

形式化的代价:严谨到"极致"

在Putnam竞赛中,看似最容易入手的微积分题(如A2、B2),反而成了形式化最大的挑战。以A2题为例,人类只需观察函数图像就能把握趋势。但Lean系统却要求将所有视觉直觉转化为严格的数学语言——包括定义域划分、单调性、拐点、边界行为等,每一步都必须显式声明。

类似地,B2题中一个简单的正性引理,在Lean中需要60多行代码才能严谨表达。这揭示了形式化数学的核心代价:它不拒绝直觉,但拒绝用直觉替代可验证的陈述。也就是说,AI不会"想当然",必须把每一步都落实到数学逻辑上。

组合构造:AI也能玩转"难题"

组合题常被视为AI的短板,近年来国际数学奥林匹克(IMO)最难的题目大多属于此类。但AxiomProver在Putnam 2025中成功破解了A5题——一道典型的归纳构造型组合问题。

人类两三段文字就能讲清的思路,在Lean中扩展为2054行代码,耗时518分钟生成。每个边界情形、每处隐含假设、每个"显然成立"的步骤,都必须展开为机器可校验的原子操作——这是从"人类可理解"走向"机器可验证"必须缴纳的形式化代价。

AI的神来之笔:人类没想到的解法

更令人惊讶的是,AxiomProver在解决A3(组合博弈)与B1(欧氏几何)这两道题时,采用了出人意料的策略。要知道,Axiom团队原本认为这两道题风险很高,因为系统尚未集成完整的几何引擎。

A3题中,AI发现后手玩家存在简洁的必胜策略,规避了复杂的博弈树搜索,契合了Lean对确定性逻辑的高效验证优势。B1题中,AI全程未绘图,却通过纯符号推理确立了"两圆恰交于两点"等关键几何事实,反倒令人类数学家需要补画草图才能理解其推导逻辑。

这表明,AI与人类的"难度感知"存在本质差异——所谓"难点",实为表征方式与验证机制的结构性不同。

数学研究的未来:人机协作

菲尔兹奖得主陶哲轩指出,当前AI已在数学推理上迈过关键门槛。波兰数学家Bartosz Naskręcki测试GPT-5.2 Pro后表示:面对非琐碎数学问题,AI极少卡死;多数高难度题在一至两小时交互内即可给出完整解答。

AxiomProver团队总结道:"看着系统实时解决竞赛数学题,确实有种说不出的震撼——尤其当它用我们根本想不到的方式解决问题。"这引出深层命题:数学题对机器的"难",不再等同于对人类的"难"。

未来数学研究或将形成新范式:人类负责提出猜想与直觉框架,机器负责形式化验证与边界探索;二者共同推动数学研究的发展。AxiomProver的Putnam满分与GPT-5.2 Pro的持续突破共同表明,通用人工智能在数学领域的突破已成为现实。