谷歌双子座 3.1 Pro 首次亮相,推理能力大幅提升

谷歌表示将发布Gemini 3.1 Pro。,将其描述为双子座 3 Deep Think 更新背后的 "升级版核心智能",并将其定位为 "任务中简单答案不够用 "的更智能基准。
Gemini 3.1 Pro 从今天开始在多个产品中推出:
- 开发者(预览版):通过 Google AI Studio、Gemini CLI、Google Antigravity 和Android Studio 提供 Gemini API
- 企业:Vertex AI 和双子座企业版
- 消费者:Gemini 应用程序和 NotebookLM
谷歌强调 ARC-AGI-2 的 "验证 "分数为 77.1%
谷歌对Gemini 3.1 Pro 的主要性能要求谷歌将 ARC-AGI-2 描述为评估模型解决全新逻辑模式能力的基准。谷歌称,Gemini 3.1 Pro 在 ARC-AGI-2 上取得了 77.1% 的验证分数,并称这是 Gemini 3 Pro 推理性能的 "两倍多"。
作为参考,谷歌 DeepMind 官方的 Gemini 3 Pro 基准测试表显示,Gemini 3 Pro 的 ARC-AGI-2 (ARC Prize Verified)得分率为 31.1%。
谷歌称 Gemini 3.1 Pro 有何作用
谷歌将 Gemini 3.1 Pro 定义为一种模型,旨在将高级推理应用于实际工作流程,例如:
- 根据提示生成网站可用的 SVG 动画、
- 构建可视化国际空间站遥测数据流的实时仪表盘、
- 制作代码驱动的交互式体验(谷歌的示例:三维椋鸟杂音)。
可用性详情和计划限制
谷歌表示,Gemini 3.1 Pro 将以预览版的形式推出,并在 "即将全面上市 "之前对更新进行验证。在消费者方面,谷歌补充说,Gemini 应用程序中的 Gemini 3.1 Pro 将向谷歌 AI Pro 和 Ultra 计划的用户推出更高的限制,而NotebookLM 访问权限则被列为 Pro 和 Ultra 计划的独享权限。则被列为 Pro 和 Ultra 用户独享。
仅从谷歌的帖子中我们仍无法确认的是
谷歌的帖子重点介绍了推出情况和基准亮点,但并不包括完整的规格表,如定价、各国可用性或准确的 API 型号名称等细节。关于这些细节,谷歌建议开发人员和企业访问Gemini API 和 Vertex AI 的官方文档。.
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名





