AI热点 4月前 • 181 阅读 • 0 评论

OpenAI拿下IOI金牌，仅次于前五名人类选手！参赛推理模型才夺金

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

机器之心报道

编辑：杜伟

一觉醒来，OpenAI 的大模型又完成了一项壮举！

在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克（IOI）中，OpenAI 的推理模型取得了足以摘得金牌的高分，并在 AI 参赛者中排名第一！

IOI 2025（即第 37 届国际信息学奥林匹克）在玻利维亚的苏克雷举行，7 月 27 日正式开幕，并已于 8 月 3 日落下了帷幕。在此次赛事中，中国队大获全胜，全员金牌夺冠。

而就在不久前，OpenAI 刚刚在 IMO（国际数学奥林匹克竞赛）2025 中拿到了金牌级别的成绩。

在比赛中，OpenAI 参加了 IOI 的在线 AI 赛道，在 330 位人类参赛者中，所用推理模型的得分只落后于 5 位人类选手，拿下了 AI 参赛者中的 No 1。

与人类选手一样，OpenAI 遵守了 5 小时答题时间和 50 次提交的限制。

同样地，OpenAI 没有使用互联网或 RAG（检索增强生成），仅能访问一个基础的终端工具。

OpenAI 使用了一组通用推理模型，并且没有针对 IOI 进行专门的训练。唯一的辅助策略是选择要提交的解答，并与 IOI API 建立连接。

相较于去年 IOI 的表现，OpenAI 今年的这一成绩实现了巨大飞跃。

去年，OpenAI 仅差一点就拿到了铜牌，并且当时依赖一个更加人工定制的测试策略。短短一年的时间，OpenAI 的成绩就从第 49 百分位跃升到第 98 百分位！

过去几周，OpenAI 在 AtCoder 世界总决赛、IMO 和 IOI 上都取得非常好的成绩，展示了最新研究方法带来的巨大进步，这些让人非常兴奋。OpenAI 正努力构建更聪明、更强大的模型，未来将尽快将它们带入主流产品中。

下图为备战 IOI 2025 的团队成员以及长期推动 OpenAI 竞技编程的团队成员。

OpenAI 联合创始人、总裁 Greg Brockma 盛赞了此次 IOI 中自家模型「金牌级的表现」。

OpenAI 专注于多步推理、自博弈和多智能体 AI 的研究科学家 Noam Brown 表示，「重要的启示是：我们在 IMO 上取得金牌的模型就是最好的竞赛编程模型。」

他分享了更多的细节：在 IMO 结束后，他们对 IMO 金牌模型进行了全面评测，发现它不仅在竞赛数学方面表现最佳，在包括编程在内的许多其他领域也是最强的模型。

所以，团队决定直接使用完全相同的 IMO 金牌模型，不做任何改动，将它应用到 IOI 竞赛系统中。

IOI 比赛中的辅助策略包括：先从几个不同的模型中采样解答，然后再用另一个模型结合启发式方法来筛选要提交的解答。最终获得了金牌，在所有参赛选手中排名第 6。

事实证明，在 OpenAI 采样的所有模型中，IMO 金牌模型的表现确实是最好的。

对于此次 OpenAI 在 IOI 赛事中取得金牌，网友感叹到：没有专门训练就取得了这样的成绩，很了不起，这意味着通用推理能力正变得非常强大。

对于这个模型的「真身」，大家也是各种猜测。

也许正如下面这位网友所言，大家现在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 夺金推理模型的相同（或更强）技术的公开版本！看起来将会是又一次全方位的重大飞跃。

所以，OpenAI，别光顾着自夸，赶紧发布吧。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

1月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

1月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

1月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

1月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

1月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

1月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

1月前 • AI热点

热门标签

GPT-4o绘图颜值 GPT-Image plog AI影像激励计划网络诽谤《自然・机器智能》纳德拉扎克伯格对话 GPT-4.1nano 知识产权

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝