AI热点 2小时前 95 阅读 0 评论

陶哲轩联手ChatGPT!10分钟击碎30年「无理」难题,数学圈炸裂

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

数学界再次见证奇迹!


陶哲轩把ChatGPT玩出了新花样:


在外人看来,两个看似无关的数学问题,在ChatGPT协助下,他发现了隐蔽的联系,从而解决了多年悬而未决的问题。


而这位顶级华人数学家付出的只是问了ChatGPT几个问题,耗时不到10分钟:






陶哲轩露了一小手


具体而言,将erdosproblems.com第259项与在线整数数列百科全书(The On-Line Encyclopedia of Integer Sequences,OEIS)的A371134条目建立了联系。


「Erdős问题」erdosproblems.com网站收录了近千道由数学家Paul Erdős提出或转述的问题,并记录了每道题目的当前状态。


目前,大部分问题仍待解决,大约三分之一的问题已被解决。



1985年,Paul Erdős和10岁的陶哲轩一起讨论问题


通过ChatGPT,陶哲轩刚刚解决了编号259的Erdős问题。



第259号Erdős问题:https://www.erdosproblems.com/259


之前,陶哲轩与Stijn Cambie和Vjeko Kovač相互讨论,最终成功正式解决了379号Erdős问题(甚至已在Lean系统中形式化)。



与上述网站相比,OEIS是一个历史更悠久的数据库,记录了成千上万条整数数列,许多与某些具体数学问题有关。


只要能算出某个问题所关联的整数数列的前几项,研究者便可借助OEIS检索相关文献和背景。


陶哲轩注意到有些埃尔德什问题与某些特定级数的无理性有关。


换句话,只要算出这些级数的前几项,就能在OEIS找到相关文献。



陶哲轩让AI计算了其中4项的近似数值(保留多位小数) ,再将这些小数字符串输入OEIS进行检索。OEIS系统返回了多个匹配结果。



A371134链接:https://oeis.org/A371134


而A371134的页面中,列出了一篇1999年出版的论文,其中已经给出了对259号Erdős问题的完整解答


值得一提的是,这篇论文由南京师范大学教授Yong-Gao Chen和匈牙利科学院数学研究所的Imre Z. Ruzsa合作撰写。



传送门:https://doi.org/10.1023/A:1004742930674


值得注意的是,这篇论文此前并未被erdosproblems.com收录。


因此,现在该问题被正式「解决」。


这是一次将「埃尔德什问题」和OEIS序列链接起来的首次概念验证(proof-of-concept),且已经产生了实质性成果。


数学家里「氛围编程」第一人


这次的经历,让陶哲轩看到了AI在数学研究中的价值:


半自动化的文献搜索是AI工具的一个很好的应用场景,因为这种工具的输出(可能存在一定的不确定性)仅用于找到更靠谱的的人类自己生成的资源,而不是直接用于最终产出。 


在AI+Math上,他可谓开「氛围研究」(vibe research)先河。


他曾公开表示:明年,AI就能成为数学家的好帮手,成为靠谱的的数学研究合作者。



在这方面,他身体力行,甚至开通了视频账号,演示如何用Lean语言形式化数学证明,而且紧跟技术潮流使用GitHub Copilot等「Vibe coding」。



陶哲轩绝对是熟悉「vibe coding」的程序员中成就最高的数学家(之一),极有可能是数学家里最熟悉「vibe coding」的程序员。


事实上,这次的新突破也并非纯粹的「运气好」。


在2025年8月31日,陶哲轩就发布了一项全新协作项目:


通过众包方式将Erdős问题网站与OEIS数据库系统性地建立起联系。



两者为何相关?


Erdős所提的问题中,很大一部分(无论显性还是隐含)都涉及某种整数数列——例如,对满足某种性质的结构,其在规模为n时的最大或最小可能大小 f(n)。


这类数列中有些已被OEIS收录。但更多时候,它们还未被输入OEIS,或虽已存在,却尚未在Erdős网站上建立链接。


为此,OEIS的维护者Thomas Bloom与陶哲轩提议发起一项众包计划,系统地计算这些Erdős问题所涉及的数列,并将它们与OEIS进行交叉检查。


他们已经创建了一个Github仓库来协调这个过程。



Github项目:https://github.com/teorth/erdosproblems


仓库的主文件是一张大型表格,记录了每道 Erdős 问题的当前状态。例如,第3号问题当前被标为 「Open」(开放),其OEIS状态被标注为 「possible」(可能存在相关数列)。



项目核心内容:状态表


例如,第3号问题涉及数列r_k(N),定义为从 {1,…,N}中挑选不含长度为k的等差数列的最大子集的大小。


这些数列r3(N)、r4(N)、……很可能已在OEIS中,只需搜索关键词或计算前几项对比即可。(更新:已有贡献者确认,前四个数列分别对应A003002、A003003、A003004和A003005,表格已据此更新。)


很多问题中涉及的数列,其实不需要高深数学知识就能计算。


陶哲轩希望这能成为一个「公众数学」项目,吸引更多对数学感兴趣的公众共同参与,通过贡献实验性数据和线索,推动研究级问题的整理与发现。


此外,该项目也提供了一个AI在数学辅助工具中应用的试验场


AI可用于自动计算数列前几项,或生成代码来实现;  


但需要警惕AI生成内容中的潜在bug或幻觉;  


不过,只要AI给出的结果成功匹配了OEIS中已有数列,任务就算完成;  


且最终成果仍然依赖于OEIS或人类验证的文献,因此不必将AI结果直接纳入数据库。


这仍是一个实验性项目,未来可能会根据反馈调整工作流程。


一句话总结:这是一次将历史悠久的数学问题集与现代数据工具(OEIS、GitHub、AI)结合的尝试,也是一次探索「群众参与+实验数据+智能工具」在数学研究中如何协同发力的实践。


参考资料:


https://mathstodon.xyz/@tao/115135610687969581


https://terrytao.wordpress.com/2025/08/31/a-crowdsourced-project-to-link-up-erdosproblems-com-to-the-oeis/



文章来自于微信公众号 “新智元”,作者 “新智元”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!