CheckMag | 英特尔在 2023 年超级计算机大会上击败 AMD 的战果比 50 万台 Ryzen 9 还大--真的是这样

Aurora 终于在今年夏天首次亮相，比原定计划晚了大约 50 年，即两代 Nvidia 显卡，或六次《使命召唤》版本。(图片：阿贡国家实验室）

在互联网上，游戏框架可能被炒得沸沸扬扬，但当企业界拥有更多的资金时，互联和加速器的世界就显得重要得多。

Matthew Lee, 👁 Daniel R Deakin (translated by Ninh Duy), Published 12/09/2023 🇺🇸 🇫🇷 ...

AI AMD Intel Server/Datacenter Opinion / Kommentar GPU

Opinion by Matthew Lee

Views, thoughts, and opinions expressed in the text belong solely to the author.

在11月举行的 "超级计算2023 "大会上，全球最强大超级计算机Top500更新名单。英特尔的 Aurora 系统（原计划于 2018 年推出）未能超越 AMD 的 Frontier 机器。安装在阿贡国家实验室（Argonne National Laboratory）的 Aurora 在高性能 LINPACK（HPL）基准测试中取得了 585.34 PetaFLOPS 的成绩，而安装在田纳西州橡树岭国家实验室（Tennessee's Oak Ridge National Laboratory）的 Frontier 则以 1194 PFLOPS 的 HPL 成绩保持领先。这两个数字都让Ryzen 9 7950X 在 HPL 测试中取得的 <1 TeraFLOP 的成绩相形见绌。在Puget Systems 的 HPL 测试中取得的 <1 TeraFLOP 成绩相形见绌。(尽管后者在亚马逊上的售价要便宜得多）。

当然，这里还需要加上很多星号。Aurora 于 6 月下旬才安装完毕，此后一直在进行调整和稳定性测试；提交给 Top500 的结果有点令人失望，因为只有一半的机器在运行。延迟的主要原因是合作伙伴而不是英特尔自己的失误。延迟并不只是相同硬件的静态时间转移，英特尔芯片在最终产品中的应用也比最初设想的要先进得多。这样的例子不胜枚举。

但问题是，很多关注这一切的人可能并不关心 这些。

自 2022 年 5 月超越 Fugaku 并突破 1-ExaFLOP 大关以来，Frontier 一直稳居榜首。(图片：Top500）

对于商业客户来说，执行力是关键。如果服务水平协议要求正常运行时间达到 5 个 9，那么 99.999% 的正常运行时间就不可能有太多的星号。从这个角度看，英特尔公司（最高级别，由政府客户（美国能源部）签约）排名第二，被一个早一年半交付的系统击败，而该系统的延迟时间之长，甚至在竞争对手宣布https://www.notebookcheck.net/AMD-and-Cray-are-building-world-s-fastest-exascale-supercomputer.420246.0.html 之前就应该投入使用了。

这样的结果可能会对商业市场产生重大影响，尽管这些系统看起来就像一座象牙塔，与现实世界中的机架格格不入。正如 Nvidia 在高端消费级图形处理器上的表现让其在硬件发烧友中拥有了不可动摇的地位一样，AMD 的 "前线"（Frontier）也坐上了头把交椅，并在过去的 18 个月里一直捍卫着自己的地位，它的光环效应可能会影响到 EPYC 处理器和 Radeon Instinct 加速器。反之亦然，英特尔的至强 CPU 和 Xe 加速器也会受到这次失败的影响。的失败（以及 Aurora 更广泛的困境），无论其优点如何。

此外，还有功耗问题。虽然 Aurora 的功耗仅为之前宣称目标的 2-ExaFLOP（即 2,000 PetaFLOPs）的四分之一左右，但它仍是英特尔的目标。英特尔之前宣称的目标，但它的耗电量却几乎只有英特尔的一半。这使得它的耗电量达到 24.7 兆瓦，实际上比 Frontier 高出近 2 兆瓦，而一旦考虑到 Frontier 的耗电量为 1.194 ExaFLOPs，那么蓝队的效率情况就尤为严峻了。

这可能有几种解释，但没有一种能让英特尔好看。也许是大肆宣传的蓝宝石急流服务器 CPU 和 Ponte Vecchio GPU 从一开始就低效得可怕；也许是公布的功耗包括了整台超级计算机的基础架构和冷却系统，而不仅仅是提交给 Top500 榜单的那一半；或者是系统的另一半也在运行，显示出相当令人不安的高闲置功耗。无论如何，从标题数字来看，英特尔解决方案的效率还不到竞争对手的一半--即使巨型超级计算机本身并不适用于潜在的企业客户，但电费账单肯定是适用的。

尽管最初为 Aurora 设计的 "Knight's Hill "至强 Phi 处理器从未实现，但英特尔在此后的几年中不断提高该系统的性能目标。(图片：英特尔）

不过，还有一个问题：谁说它们不适用于企业界？

当然，金牌和银牌都是建立在（为）定制的高性能计算平台上的，但微软的Eagle系统也登上了领奖台。Eagle的561.2 PetaFLOPs数字运算能力是由更标准化的英伟达（Nvidia）HGX H100单元构建而成的，它将通过Azure云平台用于人工智能模型和虚拟机；这是一个由商用硬件制造的商用系统，在全球定制高性能计算系统中，除了两个之外，它都名列前茅。

归根结底，与规模庞大的服务器和数据中心市场相比，消费计算领域相形见绌。在性能和效率方面的巅峰对决将产生连锁反应--对芯片制造商底线的影响远远超过任何 "最佳游戏 CPU "榜单。