Place your ads here email us at info@blockchain.news
NVIDIA Blackwell 用先进架构革新 AI 工厂 - Blockchain.News

NVIDIA Blackwell 用先进架构革新 AI 工厂

realtime news Sep 18, 2025 16:38

NVIDIA 发布 Blackwell,这是一种突破性的架构,旨在为 AI 工厂提供动力,以前所未有的规模和效率提升 AI 推理能力。

NVIDIA Blackwell 用先进架构革新 AI 工厂

NVIDIA 推出了其最新的创新成果,Blackwell 架构,旨在重新定义 AI 推理的格局。据 NVIDIA 的博客称,这一新架构旨在为即将处理最复杂 AI 模型的 AI 工厂提供动力。

不断增长的需求和模型复杂性

Blackwell 架构专为满足日益增长的 AI 处理能力需求而设计。如今的 AI 模型因其庞大的复杂性而著称,通常包含数千亿个参数。预计未来的模型参数将超过一万亿,需要强大的基础设施能够扩展和适应这些需求。

为了解决这一问题,Blackwell 专注于通过将数千台计算机集成至统一的系统来扩大数据中心的规模,大幅提升性能和能效。这一方法对于为每周服务近十亿用户的 AI 工厂提供动力至关重要。

当今最具挑战性的计算形式

AI 推理被认为是当今最具挑战性的计算形式,需求灵活且可扩展的基础架构。NVIDIA 的 GB200 NVL72 系统正是这一点的体现,通过高级软件编排计算、网络、存储、电力和冷却,作为一个大型的 GPU 进行运作。该系统集成了数万台 Blackwell GPU,展示了 Blackwell 架构在 AI 工厂中的潜力。

超级芯片的诞生

NVIDIA Grace Blackwell 超级芯片是该架构的核心组件,结合了两个 Blackwell GPU 和一个 NVIDIA Grace CPU。NVIDIA NVLink 技术促进了这种集成,使 CPU 和 GPU 之间可以无缝通信和内存共享,提升 AI 工作负载的性能和吞吐量。

消除瓶颈的骨干

NVLink Switch 脊柱是另一个重要创新,旨在消除性能瓶颈,通过超过 5000 根高性能铜缆连接 18 个计算托盘上的 72 个 GPU。此基础设施可以以惊人的 130 TB/s 速度移动数据,体现了该架构处理大规模 AI 推理的能力。

为推理打造一个巨大的 GPU

NVIDIA 的 GB200 NVL72 系统重量超过一吨半,包含超过 600,000 个零件,作为一个虚拟 GPU 运作。该系统代表了工厂规模 AI 推理的顶峰,精准与效率至为关键。

无处不在的 GB200 NVL72

NVIDIA 已经拆解了 GB200 NVL72 系统,使合作伙伴和客户可以自行配置 NVL72 系统。这些系统在全球超过150家工厂制造,反映出 NVIDIA 扩展 AI 技术覆盖面和能力的承诺。

是时候向外扩展了

数万台 Blackwell NVL72 系统的汇聚创造了能够作为统一实体运行的 AI 工厂。NVIDIA 的 Spectrum-X 以太网和 Quantum-X800 InfiniBand 交换机促进了这种集成,确保在数据中心中的无缝通信和效率。

打开沟通的渠道

为了支持 AI 工厂,NVIDIA BlueField-3 DPU 卸载和加速非 AI 任务,优化网络、存储和安全操作。此增强确保 AI 工作负载被优先处理,最大化 AI 工厂的效率和输出。

AI 工厂操作系统

NVIDIA Dynamo 作为这些 AI 工厂的操作系统,协调和调度 AI 推理请求,以优化生产力和成本效率。它动态地在工作负载中分配 GPU,适应用户需求并确保最佳性能。

总之,NVIDIA 的 Blackwell 架构不仅仅是一次技术进步;它是一个变革性的平台,旨在为未来的 AI 推理提供动力,使建造世界上最大的计算集群成为可能。

Image source: Shutterstock