Notebookcheck Logo

谷歌 DeepMind 的 "双子座 "在 2025 年国际数学奥林匹克竞赛中获得金牌

去年,只有 DeepMind 的 AlphaProof 和 AlphaGeometry 2 模型达到了银奖标准。图:谷歌的抽象艺术。(图片来源:谷歌)
去年,只有 DeepMind 的 AlphaProof 和 AlphaGeometry 2 模型达到了银奖标准。图:谷歌的抽象艺术。(图片来源:谷歌)
谷歌 DeepMind 的 Gemini 解决了 IMO 2025 六个问题中的五个,获得了金级认可。它在规定的 4.5 小时竞赛时间内用自然语言给出了解决方案。
AI

第 66 届国际数学奥林匹克竞赛(IMO)澳大利亚举行的第 66 届国际数学奥林匹克竞赛(IMO)是人工智能领域的一大盛事。谷歌 DeepMind 的双子座 "深度思考 "模型在比赛中首次亮相。 "深度思考 "模型在六道难度极高的奥林匹克问题中解决了五道,获得了 42 分中的 35 分,达到了 IMO 评级委员会设定的金牌门槛。

与去年相比,这是一个相当大的进步。去年,DeepMind 的 AlphaProof 和 AlphaGeometry 2 只解决了 4 个问题,得到 28 分,达到了银牌标准。去年,DeepMind 的 AlphaProof 和 AlphaGeometry 2 只解决了 4 个问题,得了 28 分,达到了银牌标准。

今年,Gemini 系统只使用自然语言进行端到端操作,在 4.5 小时的比赛时间内直接从 IMO 官方描述中生成完整、严谨的解决方案。IMO 的官方评分员(他们也负责评估人类参赛者)将 Gemini 的答案描述为 "清晰 "和 "精确"。DeepMind 将这一进步归功于先进的强化学习技术、经过整理的数学解法数据库,以及可以同时探索多种解法路线的新型并行推理方法。而其他人工智能系统,包括来自 OpenAI等其他人工智能系统据说也取得了类似的非官方成绩,但 Gemini 的评估结果却得到了奥林匹克竞赛协调员的正式认证,这在自主数学系统中尚属世界首例。

DeepMind 正计划在更广泛地推广之前,向部分数学家提供 Deep Think 模型,同时继续推动自然语言和形式推理代理在数学研究中的应用。

资料来源

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 07 > 谷歌 DeepMind 的 "双子座 "在 2025 年国际数学奥林匹克竞赛中获得金牌
Anubhav Sharma, 2025-07-22 (Update: 2025-07-23)