NVIDIA Blackwell 在 InferenceMAX 基准测试中以无与伦比的 AI 效率主导

NVIDIA Blackwell 在 InferenceMAX 基准测试中以无与伦比的 AI 效率主导 - Blockchain.News

NVIDIA 的 Blackwell 平台在新的 SemiAnalysis InferenceMAX v1 基准测试中取得了显著成就，在各种 AI 模型和现实场景中提供了卓越的性能和效率。此独立基准衡量计算的总成本，为 AI 推断的经济学提供了宝贵的见解，根据 NVIDIA 的博客。

无与伦比的投资回报

NVIDIA GB200 NVL72 系统以其卓越的投资回报率（ROI）脱颖而出。对该系统的 500 万美元投资可以产生 7500 万美元的 DSR1 代币收入，标志着 15 倍的 ROI。这个令人印象深刻的经济模型突出显示了 NVIDIA 的 AI 解决方案在提供可观的财务回报方面的潜力。

效率与性能

NVIDIA 的 B200 软件优化实现了代币成本的显著降低，在 gpt-oss 上达到了每百万代币两美分。这在短短两个月内将代币成本降低了 5 倍。得益于最新的 NVIDIA TensorRT-LLM 框架，该平台在吞吐量和交互性方面同样表现出色，NVIDIA B200 在 gpt-oss 上每个 GPU 每秒处理 60,000 个代币，每位用户每秒处理 1,000 个代币。

以 InferenceMAX v1 进行高级基准测试

InferenceMAX v1 基准通过在不同平台上运行流行模型并测量各种使用案例的性能，突出显示了 Blackwell 在 AI 推断方面的领先地位。这个基准测试非常重要，因为它强调了效率和经济规模，这是现代 AI 应用程序需要多步骤推理和工具使用所必需的。

NVIDIA 与主要 AI 开发者如 OpenAI 和 Meta 的合作推动了最先进推理和效率的进步。这些合作关系确保了为全球最大的 AI 推断基础设施优化最新的模型。

持续的软件优化

NVIDIA 通过硬件-软件协同设计优化继续提高性能。TensorRT LLM v1.0 的发布标志着一个重大的突破，使大型 AI 模型变得更快、更具响应性。通过利用 NVIDIA NVLink Switch 的带宽，gpt-oss-120b 模型的性能得到了显著提升。

经济和环境影响

以每瓦特的代币数和每百万代币的成本为指标是评估 AI 模型效率的关键。与前几代相比，NVIDIA Blackwell 架构将每百万代币的成本降低了 15 倍，实现了大量成本节省，推动了更广泛的 AI 部署。

InferenceMAX 基准利用帕累托前沿来绘制性能图，反映了 NVIDIA Blackwell 如何平衡成本、能源效率、吞吐量和响应性。这种平衡确保了在真实工作负载中的最高投资回报率，强调了该平台在提供效率和价值方面的能力。

结论

NVIDIA 的 Blackwell 平台，通过其全栈架构和持续的优化，设定了 AI 性能和效率的新标准。随着 AI 进入更大规模的部署，NVIDIA 的解决方案有望提供显著的经济回报，重塑 AI 工厂的格局。

Image source: Shutterstock

Bookmark