NVIDIA NVbandwidth 工具新增多节点支持,助力 AI 基础设施测试 - Blockchain.News

NVIDIA NVbandwidth 工具新增多节点支持,助力 AI 基础设施测试

realtime news Apr 14, 2026 16:30

NVIDIA 的 NVbandwidth 基准测试工具现已支持多节点 GPU 集群,使开发者能够测量 NVLink 连接的带宽,速度可达 397+ GB/s。

NVIDIA NVbandwidth 工具新增多节点支持,助力 AI 基础设施测试

NVIDIA 扩展了其开源 NVbandwidth 工具,使其支持多节点 GPU 集群测试。随着 AI 训练规模不断扩展至互联系统,这一功能变得愈发重要。该工具现可测量跨节点边界的带宽——这对于部署大型语言模型或运行分布式训练工作负载的用户来说是一项关键指标。

作为背景介绍,NVbandwidth 用于对 CPU 与 GPU 之间以及 GPU 与 GPU 之间的数据传输速度进行基准测试。随着 GB200 机架及类似高密度配置进入数据中心,多节点功能的加入填补了一项日益紧迫的空白。

测试数据表现

来自 8-GPU 多节点配置的测试结果显示,NVLink 连接的点对点带宽稳定在 397 GB/s 左右。根据 NVIDIA 于 2025 年 5 月发布的最新 NVLink Fusion 规格,这大约是 PCIe Gen5 吞吐量的 14 倍。

该工具测量三种主要传输模式:主机到设备、设备到主机以及设备到设备。每种模式都可以使用 CUDA 的复制引擎或自定义流式多处理器内核进行测试——后者有助于了解实际应用代码的性能表现与理论硬件上限之间的差距。

实际应用场景

机器学习基础设施团队会发现该工具在多种场景下非常实用。机架安装后的硬件验证是最显而易见的用途——确认新 GPU 是否真正达到预期的带宽数值。但该工具同样适用于驱动程序更新后的回归测试,或者用于排查为何某个训练任务突然比上周慢了 15%。

多节点功能需要 NVIDIA 的节点间内存交换服务(IMEX)和 MPI 进行协调。设置并非轻而易举,但对于运行分布式训练的集群而言,测量实际的跨节点带宽远胜于猜测互联网络是否是瓶颈所在。

技术要求

单节点测试适用于 CUDA 11.x 及以上版本。多节点测试需要 CUDA 12.3 及 550 或更高版本的驱动程序。该工具以纯文本或 JSON 格式输出结果,便于集成到监控流水线中。

NVbandwidth 可在 NVIDIA 的 GitHub 仓库获取。鉴于 AI 基础设施日益复杂——以及在生产环境中调试性能问题的高昂成本——拥有一款能够跨拓扑配置工作的标准化基准测试工具,确实满足了切实的需求。

Image source: Shutterstock