NVIDIA 扩展 Spectrum-X，推出 AI 扩展的开放 MRC 协议

NVIDIA 公布了其 Spectrum-X 以太网平台的一次重大升级，推出了作为开放标准的多路径可靠连接（Multipath Reliable Connection, MRC）协议。MRC 专为千亿级规模的AI设计，旨在优化网络性能和弹性，以应对 AI 开发中对强大数据中心基础设施日益增长的需求。这一公告发布之际，Spectrum-X 正在被 OpenAI、Microsoft 和 Oracle 等行业领导者广泛采用。

Spectrum-X 以太网的核心设计能够满足高级 AI 工作负载对巨大带宽和低延迟的需求。通过增加 MRC，该平台现在可以动态地使数据流经多个网络路径，从而提升吞吐量、负载均衡和故障容错能力。在需要数千个 GPU 同步协作的 AI 工厂中，这种能力尤为重要。

“在 Blackwell 代中部署 MRC 非常成功，”OpenAI 工业计算负责人 Sachin Katti 表示。他指出，MRC 的设计显著减少了网络减速现象，从而提高了大规模 AI 模型训练的效率。OpenAI 自己的 AI 训练集群依赖这项技术，即使在极端需求下也能确保工作负载平稳运行。

Microsoft 的 AI 数据中心 Fairwater 和 Oracle 的 Abilene 基础设施也已集成了 MRC，这进一步表明了其在行业中的广泛采用。这些超大规模环境专为训练最前沿的大型语言模型（LLMs）而设计，受益于 Spectrum-X 以太网平台提供的一致且高性能的网络能力。

为何 MRC 对 AI 工厂至关重要

MRC 的创新之处在于其能够智能地分配网络流量。通过在多个路径间进行负载均衡，它确保 GPU 能够保持高利用率而不出现瓶颈。如果某条网络路径发生拥塞或故障，MRC 可以在微秒内重新路由流量，从而防止可能中断长时间训练的干扰。这种级别的韧性对于 AI 工厂至关重要，因为即使是短暂的停机也可能带来显著的运营和财务成本。

该协议还结合了先进的遥测和控制功能，为管理员提供了对网络行为的细粒度可视性。这简化了故障排除，并确保在通常涉及成千上万个 GPU 的环境中平稳运行。

NVIDIA 的以太网优势

NVIDIA 一直将 Spectrum-X 以太网定位为 InfiniBand 的强大替代方案，后者一向在 AI 网络领域占据主导地位。该平台利用 Spectrum-4 以太网交换机和 BlueField-3 SuperNIC 等硬件，提供针对 AI 工作负载的高带宽和低延迟。最近的进展，例如 2026 年 2 月推出的 Spectrum-XGS，进一步扩展了其能力，使其成为超大规模数据中心的可行选择。

与作为专有系统运行的 InfiniBand 不同，Spectrum-X 以太网拥抱开放标准。将 MRC 作为开放计算项目的一部分发布，显示了 NVIDIA 致力于促进更具协作性的生态系统的承诺。这可能会加速跨行业的采用，并强化以太网在 AI 基础设施中的角色。

扩展到千亿级 AI

NVIDIA 的多平面网络设计，依托于 Spectrum-X 的硬件，是另一个关键差异点。通过支持具有硬件加速负载均衡的独立网络平面，它允许数据中心在不牺牲性能的情况下扩展。这种架构对于行业向 AI 超级工厂迈进至关重要，这些工厂需要增长基础设施以应对日益复杂的模型和数据集。

展望未来，Spectrum-X 以太网与 MRC 的整合使 NVIDIA 在 AI 网络领域占据领导地位。随着对 AI 训练基础设施需求的激增，不仅提供速度，还提供韧性和智能的技术将变得不可或缺。对于像 OpenAI 和 Microsoft 这样处于 AI 开发前沿的组织而言，这种组合可能会成为颠覆游戏规则的力量。

通过 Spectrum-X 以太网，NVIDIA 不仅紧跟 AI 的快速发展步伐，还在为未来设立新标准。

Image source: Shutterstock

Bookmark

NVIDIA 扩展 Spectrum-X，推出 AI 扩展的开放 MRC 协议

为何 MRC 对 AI 工厂至关重要

NVIDIA 的以太网优势

扩展到千亿级 AI

Premium Sponsors

Flash News