AI破解数学最难“侦探题”：一个新框架正改写规则

著名数学家陶哲轩评价，2025年是AI真正开始在数学研究中发挥作用的元年，它能让数学家从"一次解决一个问题"转向"规模化探索"，人类角色将更多转向定义问题、整合知识和验证AI结果的"策展人"。

然而，警钟同样响亮。就在几个月前，OpenAI曾高调宣称GPT-5解决了10个埃尔德什问题，随后被揭露只是检索到了已有但鲜为人知的论文，甚至为一道题干本身错误的猜想，生成了一份几十页逻辑严密的"伪证明"。这暴露了当前AI的致命短板：

依赖模式识别，而非真正理解：多伦多大学的研究表明，顶尖AI模型在题目格式稍加变换后，准确率便会暴跌，说明其解题很大程度上依赖于对训练数据中"题型模板"的匹配，而非深层的数学逻辑。

缺乏对问题本质的判断：菲尔兹奖得主Akshay Venkatesh警告，过度依赖AI可能导致数学家失去对数学的"直接理解"和直觉洞察，这是数学文化中极其宝贵的部分。

所以，这意味着什么？

AI破解数学"侦探题"，意味着三件事：

AI的角色正在升级：它正从一个快速"解题"的工具，演变为能够参与"科学发现"的伙伴。其价值在于处理那些人类已知方法效率低下或无法处理的、高噪声、高复杂度的反向推理问题。

科研范式面临变革：在生物、材料、气候等领域，研究方法有望从"定性描述"和"静态观测"，迈向"动态机制反演"和"连续梯度精准设计"。这能极大加速从基础研究到技术应用的进程。

人类的角色更关键，但已不同：AI不会取代科学家，但会重新定义科学家的核心技能。未来研究者的竞争力，将体现在提出真问题、设计AI能理解的框架、以及 critically 审视和验证AI产出的能力上。正如陶哲轩所言，人类需要学会成为"AI策展人"。

最终，这次突破告诉我们：最强大的AI，不是那个拥有最多算力的" brute force "机器，而是那个最懂得如何与人类千年积累的数学智慧（比如1940年代的平滑子理论）协同合作的"融合引擎"。它为我们打开了一扇窥探世界隐藏规律的新窗，但解读窗外风景的，依然是人类的好奇心与批判性思维。

AI破解数学最难“侦探题”：一个新框架正改写规则(3)