数学专业,危!菲尔兹奖得主亲测ChatGPT 5.5 Pro,17分钟出论文级成果

数学最高奖菲尔兹奖得主——Timothy Gowers,在最新体验到ChatGPT 5.5 Pro后,替学生们拉响了红色警报。

事情是这样的,这位剑桥大学的数学大牛,最近搞到了尊贵的 5.5 Pro「优速通」权限。

拿到新玩具后,Gowers随手把几道加法数论的公开难题丢给了AI,想瞅瞅怎么个事。

毕竟,他可谓是AI和数学交界线的先锋了,前段时间还联合创立了一个AI4S组织,就是想帮助年轻人寻找AI时代新出路。

加法数论大佬Mel Nathanson写了篇论文,里面列了一堆关于整数集合求和性质的公开问题。

这类问题的特点是方向明确,难度适中,数量又多,本来是留给刚入门的博士生练手、冲第一篇顶刊的黄金素材。

给定一个整数集合A,已知它有k个元素(|A|=k),也知道它的二重求和集(简单说就是集合里所有元素两两相加得到的新集合,记为2A)有多少个元素,那A的直径最小能是多少?

Nathanson自己已经证明了一个指数级的上界(2^k-1),但一直怀疑还能优化。

它的核心思路是用Sidon集(一种求和集大小最大化的特殊集合)和等差数列做组合构造。

另一种是咱们上学都学过的等差数列,把这两种积木巧妙组合起来,就搭出了满足条件的最小直径集合。

Nathanson原本的证明用了归纳法,本质上也在做类似组合积木的事,但用的是2的幂次这种效率较低的Sidon集。

这种集合的直径是二次的(简单说就是k个元素的话,直径大概是k²级别),比指数级(2^k)小了不止一个数量级,相当于用精致的小积木精准搭房,空间利用率直接拉满。

但Gowers自己也承认,相当多的人类数学研究,本质上也是在组合已有的知识和证明技巧。

把二重求和集换成限制求和集,也就是这个集合里的元素两两相加时,要求两个元素不能是同一个,其他条件不变,还能不能找到最小直径?

然后他让ChatGPT把两个结果合并写成一篇学术笔记,47分钟后,一份标准的LaTeX预印本就出来了。

然后事情开始变得更有意思,Gowers又上了难度,问了一般情形下k重求和集的直径问题。

这个问题要难得多,因为对于一般的k,我们甚至不完全知道哪些求和集大小是可以被实现的,连基本的构造框架都缺。

不过好在麻省理工学院(MIT)的学生Isaac Rajagopal已经做了开创性工作,他证明了h重求和集直径的指数级依赖关系。

Gowers想看看GPT 5.5 Pro能不能在Isaac的基础上做改进,没想到,AI直接上演了两连跳操作,还独创了k-解离集合构造

Gowers自己提了一个设想,也许应该建一个专门的AI数学成果仓库,有一定的审核流程。

比如需要人类数学家确认正确性,或者经过形式化证明助手验证,但也不要让审核本身变成巨大的工作量。

坦率的讲,这个问题目前没有答案,所以现在这个成果就挂在Gowers的博客上,靠一个链接存在着。

这直接把入门门槛抬高了,因为以前你只需要证明一个没人证过的东西,现在你得证明一个AI也证不了的东西。

未来科研门槛可以不再是硬刚「AI解不出的题」,而是在人机协作下,做出AI单独做不到的成果

Gowers自己最近也在大量做这种人机协作的数学研究,他说AI确实能提供有用的贡献,但还没到能独立产生game-changing想法的地步。

因为组合学本质上是从问题出发的反向推理,而其他数学分支更多是从想法出发的正向探索。

后者需要判断什么观察是有趣的、什么方向值得深入,这种审美判断对AI来说可能更难,目前仍是人类占优。

但他也特意强调以上都只适用于当下的AI,大模型迭代太快,现在的判断可能几个月就过时。

如果一个人做数学的目的是把自己的名字永远刻在某个定理或定义上,追求「冠名永生」,那这种时代红利可能很快就会彻底消失,对所有人都一样。

假设一个数学家通过和AI长时间对话解决了一个重大问题,数学家起了引导作用,但主要想法和全部技术工作都是AI完成的,我们会认为这是这位数学家的重大成就吗?

Gowers说,就像优秀的程序员比普通人更擅长Vibe coding,真正做过研究的数学家也会更擅长和AI协作。因为你对问题解决过程本身的理解越深,你用AI的能力就越强。

数学本身是一种高度可迁移的底层思维能力,未来数学研究者或许失去了独享定理冠名的学术荣誉,但沉淀的思维功底,会是AI时代最好的个人底气。

那就把第三步也自动化掉嘛,训练AI用更好的数学写作风格来呈现证明,让它更容易被理解。

但如果你决定彻底优化消化过程、把「需要咀嚼的量」到最低,那逻辑上的最优解就是——把所有食物丢进搅拌机,通过管子直接灌进胃里。

感官体验,还有社交场景,还有咀嚼本身带来的满足感……这些附加产物,才是人类最享受的东西。

措辞不清晰、结构混乱……这些「人工难度」,用AI读论文确实可以消除,就像把一块肉腌制一下再上桌。

看到这里,有人可能还会说:让AI解决一切,继续优化评判标准,把「自然难度」也纳入考量不就好了?

但事实上,不是所有问题都能被当做一个「优化问题」——只要无限迭代,到最后得到的结果,就一定是我们想要的。

米其林大厨手工制作的料理,至今仍然比机器加工的食品更受珍视,即使后者安全、好看、易消化、方便、口味也不差。

那些原本为年轻数学家准备的「入门赛道」,正在被AI碾平。培养体系的地基在动摇,学术发表的规则在失效。

参考链接:
[1]https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
[2]https://x.com/wtgowers/status/2052830948685676605
[3]https://mathstodon.xyz/@tao/116551624228986501

量子位 QbitAI