第 66 届国际数学奥林匹克竞赛(IMO)澳大利亚举行的第 66 届国际数学奥林匹克竞赛(IMO)是人工智能领域的一大盛事。谷歌 DeepMind 的双子座 "深度思考 "模型在比赛中首次亮相。 "深度思考 "模型在六道难度极高的奥林匹克问题中解决了五道,获得了 42 分中的 35 分,达到了 IMO 评级委员会设定的金牌门槛。
与去年相比,这是一个相当大的进步。去年,DeepMind 的 AlphaProof 和 AlphaGeometry 2 只解决了 4 个问题,得到 28 分,达到了银牌标准。去年,DeepMind 的 AlphaProof 和 AlphaGeometry 2 只解决了 4 个问题,得了 28 分,达到了银牌标准。
今年,Gemini 系统只使用自然语言进行端到端操作,在 4.5 小时的比赛时间内直接从 IMO 官方描述中生成完整、严谨的解决方案。IMO 的官方评分员(他们也负责评估人类参赛者)将 Gemini 的答案描述为 "清晰 "和 "精确"。DeepMind 将这一进步归功于先进的强化学习技术、经过整理的数学解法数据库,以及可以同时探索多种解法路线的新型并行推理方法。而其他人工智能系统,包括来自 OpenAI等其他人工智能系统据说也取得了类似的非官方成绩,但 Gemini 的评估结果却得到了奥林匹克竞赛协调员的正式认证,这在自主数学系统中尚属世界首例。
DeepMind 正计划在更广泛地推广之前,向部分数学家提供 Deep Think 模型,同时继续推动自然语言和形式推理代理在数学研究中的应用。
资料来源
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名