Notebookcheck Logo

Grok 4 击败 ChatGPT,成为顶级公开人工智能模型,埃隆-马斯克(Elon Musk)兜售每月 300 美元的高级订阅服务

Grok 4 人工智能语言模型徽标。(图片来源:xAI)
Grok 4 人工智能语言模型徽标。(图片来源:xAI)
根据第三方测试平台的数据,埃隆-马斯克(Elon Musk)的 xAI 公司新推出的 Grok 4 现在是公众可获得的最佳人工智能模型,击败了 ChatGPT 或谷歌的双子座。xAI 团队还推出了名为 Grok 4 Heavy 的新的昂贵人工智能订阅选项。
AI Business

在发布两年多之后,xAI 的 Grok 已成为领先的人工智能语言模型,超过了 OpenAI 的 ChatGPT、谷歌的 Gemini 或 DeepSeek,以及 Meta 和 Anthropic。埃隆-马斯克说,Grok 将于下周进入特斯拉汽车。

根据独立第三方的测试,新发布的 Grok 4 目前已在公共人工智能模型性能排行榜上名列前茅。Grok 3 和 Grok 4 的推理能力提高了 10 倍,其背后的驱动力是 xAI 以惊人的速度建立的人工智能计算集群,在向计划中的 100 万个 GPU 迈进的过程中,计算集群的 GPU 数量翻了一番,达到了 20 万个。

xAI 团队联系了要求苛刻的 ARC-AGI 性能测试的幕后人员,请他们运行自己的人工智能测试套件,结果令人惊讶:

首先是事实:Grok 4 现在是 ARC-AGI 上性能最高的公开可用模型。这甚至超过了在 Kaggle 上提交的专用解决方案。其次,ARC-AGI-2 对当前的人工智能模型来说很难。要想取得好成绩,模型必须从一系列训练实例中学习一种小技能,然后在测试时展示这种技能。之前的最高分是 8%(Opus 4)。低于 10%的分数是很嘈杂的。Grok 4 的得分达到 15.9%,突破了噪音障碍,显示出了非零水平的流体智能。

另一家独立人工智能测试机构人工分析公司(Artificial Analysis)表示,他们

"运行了我们的全套基准测试,Grok 4 的人工分析智能指数达到 73,领先于 70 的 OpenAI o3、70 的 Google Gemini 2.5 Pro、64 的 Anthropic Claude 4 Opus 和 68 的 DeepSeek R1 0528"。

根据埃隆-马斯克在 Grok 4 发布会上的介绍,xAI 的模型现在比所有学科的研究生加起来都要聪明。特斯拉首席执行官典型的天马行空,他声称 Grok 4 将能够发现 "新技术",例如 药物或工程突破。

不过,他也承认,在未来一个月左右的时间里,Grok 的图像识别能力仍然很差,并针对最近的至上主义答案争议表示他说,"当 Grok 出大错时,通常是由于我们做了一些愚蠢的事情,比如一个糟糕的系统提示,或者过于重视有偏见的来源

马斯克需要给 Grok 4 打气,因为他的 xAI 首次推出了付费的高级层级。它被称为SuperGrok Heavy,起价为300美元/月,包括30美元/月的SuperGrok层级中的内容,该层级提供Grok 4的初始访问权限,以及访问Grok 4 Heavy平台的权限,该平台提供更高的费率限制和新功能的早期访问权限。

Grok 3 将继续免费提供给普通用户使用,而每一位 X Premium+ 用户都可以通过 SuperGrok 层级访问 Grok 4。

Grok vs ChatGPT vs Gemini AI 模型历史性能图。
Grok vs ChatGPT vs Gemini AI 模型历史性能图。
顶级人工智能模型排名。
顶级人工智能模型排名。

资料来源

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 07 > Grok 4 击败 ChatGPT,成为顶级公开人工智能模型,埃隆-马斯克(Elon Musk)兜售每月 300 美元的高级订阅服务
Daniel Zlatev, 2025-07-10 (Update: 2025-07-10)