AI热点 4小时前 112 阅读 0 评论

GPT-5 Pro 独立做数学研究:读论文后给出更精确边界,OpenAI 总裁称这是生命迹象

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

AI 已经能够自主思考并证明新的数学规律了?OpenAI 研究人员表示,自己喂给 GPT-5 Pro 一篇论文,结果模型读完之后得到了新的结论。

在凸优化问题当中,GPT-5 Pro 针对一个边界问题,给出了比原文更加精确的阈值和相应证明。消息立即引发全网热议,不到半天推文就有 230 多万次阅读。

不过这位研究人员并没有将 GPT-5 Pro 的研究成果发表成论文,理由是被人类抢先了 —— 这篇论文后来又更新了一个版本,给出了新的边界,这个新的边界又把 GPT-5 Pro 反超了。

但是,GPT-5 Pro 的证明思路与此并不相同,说明它已经具备了独立探索的能力,所以人类的反攻也不影响这是 GPT-5 Pro 的一个新突破。OpenAI 总裁 Brockman 甚至将这一成果称之为“生命迹象”

凸优化曲线是凸的吗?

喂给 GPT-5 Pro 的这篇论文,研究的是凸优化(convex optimization)问题,凸优化是数学最优化的一个子领域,研究定义于凸集中的凸函数最小化的问题。

具体来说,这篇论文题目为《凸优化曲线是凸的吗?》,研究了这样的一个问题:

当使用梯度下降算法优化光滑凸函数时,其产生的优化曲线(optimization curve)是否是凸的?

这里的“优化曲线”指的是函数值 f (x_n) 随迭代次数 n 变化的曲线。如果这条曲线是凸的,意味着优化速率(即相邻两次迭代的函数值下降量)是单调递减的。

关于这个问题,论文的结论是优化曲线凸不凸,关键取决于步长(step size)的选择,具体包括如下几个关键点:

  • 凸性保证区间:当步长 η ∈ (0, 1 / L] 时(L 为平滑度),优化曲线保证是凸的;

  • 非凸可能区间:当步长 η ∈ (1.75 / L, 2 / L) 时,即使梯度下降仍单调收敛,优化曲线可能不是凸的;

  • 梯度范数性质:对于整个收敛区间 η ∈ (0, 2 / L],梯度范数序列 ||∇f (x_n)|| 总是单调递减的;

  • 二阶可导凸函数的梯度流凸性:对于凸且二阶连续可导的函数,梯度流的优化曲线总是凸的;

  • 光滑凸函数的梯度流凸性:对于凸 L-光滑函数(不要求二阶可导),梯度流的优化曲线总是凸的;

  • 梯度流的梯度范数单调性:对于连续时间的梯度流,优化曲线总是凸的;

关于第一个结论,证明的核心是证明序列 {f (x_n) - f [(x_(n+1)]} 非递增。

论文作者巧妙地引入辅助函数 g_k (t),将离散的迭代过程转化为连续函数的积分,利用凸函数的性质证明辅助函数的单调性,通过比较相邻两个辅助函数的大小关系,最终证明优化曲线的凸性。

非凸可能区间部分则是构造一个分段函数(二次函数和线性函数的组合)作为反例实现证明。

作者选择特定的初始点 x_0 = -1.8,通过直接计算前三步迭代的函数值下降量,验证在该步长范围内,后面的下降量反而比前面大,违反了凸性要求。

由于 GPT-5 Pro 的证明主要针对的是边界问题,后面四个结论的证明过程在这里就不详细介绍了,感兴趣的话可以阅读原论文。

GPT-5 Pro 给出新边界

在论文的第一版中,作者分别证明了步长不大于 1 / L 和大于 1.75 / L 时的情况,但在 (1 / L, 1.75 / L] 范围内则未有定论。

GPT-5 Pro 则是通过更精细的不等式技巧,用 17 分半的时间把 1 / L 这个边界移动到了 1.5 / L。

而人类检查证明过程的时间,是 25 分钟,GPT-5 Pro 读论文并进行证明的时间还要长。

其核心思路与原论文相似,均是将优化曲线凸性问题转化为证明函数值下降量递减。

但 GPT-5 Pro 巧妙运用了凸 L-光滑函数的两个基本不等式 ——Bregman 散度不等式(提供更紧的下界)和标准的共强制性(cocoercivity)不等式。

通过这种巧妙的代数操作,GPT-5 Pro 成功将凸性条件进一步细化。

再之后,GPT-5 Pro 的发现还未来得及发表,论文原作者就对论文进行了更新,作者新增了一名,关键是证明了 1.75 / L 就是一个精确界限,之前未探索的区间实现了闭合。

其思路是利用凸 L-光滑函数的 Bregman 散度不等式,对三个点对 (x_0,x_1)、(x_1,x_2) 和 (x_0,x_2) 分别建立不等式,之后将三个不等式分别乘以不同权重后求和,并通过恒等式将复杂的梯度项组合化简。

虽然 GPT-5 Pro 给出的证明最后被人类扳回一城,但是,其思路和过程与新版论文不同。

也就是说,GPT-5 Pro 并不是发现了新论文才实现边界的精确化,而是确实具备了自主发现并证明数学规律的能力

参考链接:

  • [1]https://x.com/SebastienBubeck/status/1958198661139009862

  • [2]https://arxiv.org/abs/2503.10138v1

  • [3]https://arxiv.org/abs/2503.10138v2

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!