Notebookcheck Logo

华为 Atlas 950 超级集群亮相,人工智能性能达 524 ExaFLOPS

图为华为 Atlas 900 人工智能集群(图片来源:华为)
图为华为 Atlas 900 人工智能集群(图片来源:华为)
在华为Connect 2025大会上,该公司推出了Atlas 950超级集群,为人工智能训练提供524 FP8 ExaFLOPS,为推理提供1 FP4 ZettaFLOPS。该系统由超过 500,000 个 Ascend 950DT NPU 构建,超越了甲骨文和 xAI 的集群,同时挑战了 Nvidia 即将推出的 Rubin 平台。
AI Server/Datacenter Chinese Tech

华为在https://www.huawei.com/en/news/2025/9/hc-xu-keynote-speechAtlas 950 超级集群,可提供超大规模性能,524 FP8 ExaFLOPS 用于人工智能训练,1 FP4 ZettaFLOPS 用于推理。该系统的定位是与英伟达(Nvidia)基于 Rubin 的平台直接竞争,后者预计将于 2026 年底推出。Atlas 950 在超过 10,240 个机柜中集成了 524,288 个 Ascend 950DT 神经处理单元。

该架构由 64 个 Atlas SuperPoD 组成,每个 SuperPoD 包含 8,192 个 Ascend 950DT 芯片,处理单元数量是之前 Atlas 900 A3 系统的 20 倍。新架构支持 RoCE 和华为专有的 UBoE(以太网统一总线)协议,并采用全光互连,带宽为 16 PB/秒,延迟为 2.1 微秒。

Atlas 950超级集群超越了甲骨文的OCI超级集群,后者使用131,072个B200 GPU提供2.4 FP4 ZettaFLOPS。Atlas 950 还超过了 xAI的Colossus集群Atlas 950的NPU数量是xAI的Colossus集群的2.5倍,计算能力是后者的1.3倍。每个 Atlas 950 SuperPoD 可提供 8 FP8 ExaFLOPS,而 Nvidia 的 Vera Rubin NVL144 只有 1.2 FP8 ExaFLOPS。华为设计的 SuperCluster 支持千亿到数万亿参数的人工智能模型。

每个 SuperPoD 占地约 1000 平方米,相当于两个篮球场的面积,需要 160 个机柜。超级集群的总面积为 64,000 平方米,大约相当于 150 个篮球场或 9 个足球场。华为没有像 Nvidia 那样使用更强大的芯片,而是依靠更多的加速器,因此集群需要更多的空间用于供电、冷却和支持系统。

华为预计在 2026 年底推出 Atlas 950 超级集群,一年后推出 960 超级集群。960 超级集群将包括 100 多万个 NPU,提供 2 到 4 ZettaFLOPS 的计算能力。由于华为的芯片 性能较弱因此,该公司正在构建更大的系统。这些超级集群是专为下一代模型需要大量计算能力的人工智能公司设计的。

资料来源

华为(英语)

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 09 > 华为 Atlas 950 超级集群亮相,人工智能性能达 524 ExaFLOPS
Nathan Ali, 2025-09-19 (Update: 2025-09-19)