Notebookcheck Logo

谷歌双子座 3.1 Pro 首次亮相,推理能力大幅提升

谷歌发布的 Gemini 3.1 Pro 亮点在于 ARC-AGI-2 验证得分高达 77.1%,并将在消费者和开发者产品中推广使用。
ⓘ blog.google
谷歌发布的 Gemini 3.1 Pro 亮点在于 ARC-AGI-2 验证得分高达 77.1%,并将在消费者和开发者产品中推广使用。
谷歌发布了 Gemini 3.1 Pro 预览版,涵盖 Gemini 应用程序、NotebookLM、Vertex AI 和 Gemini API。谷歌强调了 77.1% 的 ARC-AGI-2 验证得分,并称其在核心推理方面向前迈进了一步。
AI Software Launch

谷歌表示将发布Gemini 3.1 Pro。,将其描述为双子座 3 Deep Think 更新背后的 "升级版核心智能",并将其定位为 "任务中简单答案不够用 "的更智能基准。

Gemini 3.1 Pro 从今天开始在多个产品中推出:

  • 开发者(预览版):通过 Google AI Studio、Gemini CLI、Google Antigravity 和Android Studio 提供 Gemini API
  • 企业:Vertex AI 和双子座企业版
  • 消费者:Gemini 应用程序和 NotebookLM

谷歌强调 ARC-AGI-2 的 "验证 "分数为 77.1%

谷歌对Gemini 3.1 Pro 的主要性能要求谷歌将 ARC-AGI-2 描述为评估模型解决全新逻辑模式能力的基准。谷歌称,Gemini 3.1 Pro 在 ARC-AGI-2 上取得了 77.1% 的验证分数,并称这是 Gemini 3 Pro 推理性能的 "两倍多"。

作为参考,谷歌 DeepMind 官方的 Gemini 3 Pro 基准测试表显示,Gemini 3 Pro 的 ARC-AGI-2 (ARC Prize Verified)得分率为 31.1%。

谷歌称 Gemini 3.1 Pro 有何作用

谷歌将 Gemini 3.1 Pro 定义为一种模型,旨在将高级推理应用于实际工作流程,例如:

  • 根据提示生成网站可用的 SVG 动画、
  • 构建可视化国际空间站遥测数据流的实时仪表盘、
  • 制作代码驱动的交互式体验(谷歌的示例:三维椋鸟杂音)。

可用性详情和计划限制

谷歌表示,Gemini 3.1 Pro 将以预览版的形式推出,并在 "即将全面上市 "之前对更新进行验证。在消费者方面,谷歌补充说,Gemini 应用程序中的 Gemini 3.1 Pro 将向谷歌 AI Pro 和 Ultra 计划的用户推出更高的限制,而NotebookLM 访问权限则被列为 Pro 和 Ultra 计划的独享权限。则被列为 Pro 和 Ultra 用户独享。

仅从谷歌的帖子中我们仍无法确认的是

谷歌的帖子重点介绍了推出情况和基准亮点,但并不包括完整的规格表,如定价、各国可用性或准确的 API 型号名称等细节。关于这些细节,谷歌建议开发人员和企业访问Gemini API 和 Vertex AI 的官方文档。.

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2026 02 > 谷歌双子座 3.1 Pro 首次亮相,推理能力大幅提升
Darryl Linington, 2026-02-22 (Update: 2026-02-22)