谷歌 DeepMind 的 "双子座 "在 2025 年国际数学奥林匹克竞赛中获得金牌

去年，只有 DeepMind 的 AlphaProof 和 AlphaGeometry 2 模型达到了银奖标准。图：谷歌的抽象艺术。(图片来源：谷歌）

谷歌 DeepMind 的 Gemini 解决了 IMO 2025 六个问题中的五个，获得了金级认可。它在规定的 4.5 小时竞赛时间内用自然语言给出了解决方案。

Anubhav Sharma (translated by Ninh Duy), Published 07/22/2025 🇺🇸 🇪🇸 ...

第 66 届国际数学奥林匹克竞赛（IMO）澳大利亚举行的第 66 届国际数学奥林匹克竞赛（IMO）是人工智能领域的一大盛事。谷歌 DeepMind 的双子座 "深度思考 "模型在比赛中首次亮相。 "深度思考 "模型在六道难度极高的奥林匹克问题中解决了五道，获得了 42 分中的 35 分，达到了 IMO 评级委员会设定的金牌门槛。

与去年相比，这是一个相当大的进步。去年，DeepMind 的 AlphaProof 和 AlphaGeometry 2 只解决了 4 个问题，得到 28 分，达到了银牌标准。去年，DeepMind 的 AlphaProof 和 AlphaGeometry 2 只解决了 4 个问题，得了 28 分，达到了银牌标准。

今年，Gemini 系统只使用自然语言进行端到端操作，在 4.5 小时的比赛时间内直接从 IMO 官方描述中生成完整、严谨的解决方案。IMO 的官方评分员（他们也负责评估人类参赛者）将 Gemini 的答案描述为 "清晰 "和 "精确"。DeepMind 将这一进步归功于先进的强化学习技术、经过整理的数学解法数据库，以及可以同时探索多种解法路线的新型并行推理方法。而其他人工智能系统，包括来自 OpenAI等其他人工智能系统据说也取得了类似的非官方成绩，但 Gemini 的评估结果却得到了奥林匹克竞赛协调员的正式认证，这在自主数学系统中尚属世界首例。

DeepMind 正计划在更广泛地推广之前，向部分数学家提供 Deep Think 模型，同时继续推动自然语言和形式推理代理在数学研究中的应用。