NVIDIA 扩展 Spectrum-X,推出 AI 扩展的开放 MRC 协议 - Blockchain.News

NVIDIA 扩展 Spectrum-X,推出 AI 扩展的开放 MRC 协议

realtime news May 06, 2026 12:31

NVIDIA 的 Spectrum-X 以太网集成了全新的 MRC 协议,为 OpenAI 和 Microsoft 等超大规模数据中心优化了 AI 网络性能。

NVIDIA 扩展 Spectrum-X,推出 AI 扩展的开放 MRC 协议

NVIDIA 公布了其 Spectrum-X 以太网平台的一次重大升级,推出了作为开放标准的多路径可靠连接(Multipath Reliable Connection, MRC)协议。MRC 专为千亿级规模的AI设计,旨在优化网络性能和弹性,以应对 AI 开发中对强大数据中心基础设施日益增长的需求。这一公告发布之际,Spectrum-X 正在被 OpenAI、Microsoft 和 Oracle 等行业领导者广泛采用。

Spectrum-X 以太网的核心设计能够满足高级 AI 工作负载对巨大带宽和低延迟的需求。通过增加 MRC,该平台现在可以动态地使数据流经多个网络路径,从而提升吞吐量、负载均衡和故障容错能力。在需要数千个 GPU 同步协作的 AI 工厂中,这种能力尤为重要。

“在 Blackwell 代中部署 MRC 非常成功,”OpenAI 工业计算负责人 Sachin Katti 表示。他指出,MRC 的设计显著减少了网络减速现象,从而提高了大规模 AI 模型训练的效率。OpenAI 自己的 AI 训练集群依赖这项技术,即使在极端需求下也能确保工作负载平稳运行。

Microsoft 的 AI 数据中心 Fairwater 和 Oracle 的 Abilene 基础设施也已集成了 MRC,这进一步表明了其在行业中的广泛采用。这些超大规模环境专为训练最前沿的大型语言模型(LLMs)而设计,受益于 Spectrum-X 以太网平台提供的一致且高性能的网络能力。

为何 MRC 对 AI 工厂至关重要

MRC 的创新之处在于其能够智能地分配网络流量。通过在多个路径间进行负载均衡,它确保 GPU 能够保持高利用率而不出现瓶颈。如果某条网络路径发生拥塞或故障,MRC 可以在微秒内重新路由流量,从而防止可能中断长时间训练的干扰。这种级别的韧性对于 AI 工厂至关重要,因为即使是短暂的停机也可能带来显著的运营和财务成本。

该协议还结合了先进的遥测和控制功能,为管理员提供了对网络行为的细粒度可视性。这简化了故障排除,并确保在通常涉及成千上万个 GPU 的环境中平稳运行。

NVIDIA 的以太网优势

NVIDIA 一直将 Spectrum-X 以太网定位为 InfiniBand 的强大替代方案,后者一向在 AI 网络领域占据主导地位。该平台利用 Spectrum-4 以太网交换机和 BlueField-3 SuperNIC 等硬件,提供针对 AI 工作负载的高带宽和低延迟。最近的进展,例如 2026 年 2 月推出的 Spectrum-XGS,进一步扩展了其能力,使其成为超大规模数据中心的可行选择。

与作为专有系统运行的 InfiniBand 不同,Spectrum-X 以太网拥抱开放标准。将 MRC 作为开放计算项目的一部分发布,显示了 NVIDIA 致力于促进更具协作性的生态系统的承诺。这可能会加速跨行业的采用,并强化以太网在 AI 基础设施中的角色。

扩展到千亿级 AI

NVIDIA 的多平面网络设计,依托于 Spectrum-X 的硬件,是另一个关键差异点。通过支持具有硬件加速负载均衡的独立网络平面,它允许数据中心在不牺牲性能的情况下扩展。这种架构对于行业向 AI 超级工厂迈进至关重要,这些工厂需要增长基础设施以应对日益复杂的模型和数据集。

展望未来,Spectrum-X 以太网与 MRC 的整合使 NVIDIA 在 AI 网络领域占据领导地位。随着对 AI 训练基础设施需求的激增,不仅提供速度,还提供韧性和智能的技术将变得不可或缺。对于像 OpenAI 和 Microsoft 这样处于 AI 开发前沿的组织而言,这种组合可能会成为颠覆游戏规则的力量。

通过 Spectrum-X 以太网,NVIDIA 不仅紧跟 AI 的快速发展步伐,还在为未来设立新标准。

Image source: Shutterstock