Place your ads here email us at info@blockchain.news
NVIDIA 的 Rubin CPX GPU 革新长上下文 AI 推理 - Blockchain.News

NVIDIA 的 Rubin CPX GPU 革新长上下文 AI 推理

realtime news Sep 09, 2025 16:46

NVIDIA 发布 Rubin CPX GPU,通过前所未有的效率增强 AI 推理,可处理 100 万以上的 tokens 工作负载,变革软件开发和视频生成等领域。

NVIDIA 的 Rubin CPX GPU 革新长上下文 AI 推理

在 AI 技术领域取得重大进展,NVIDIA 推出了 Rubin CPX GPU,这是一款专门设计用于应对日益复杂的推理工作负载的专业处理器,可处理超过百万 tokens。根据 NVIDIA 的说法,这一开发标志着 AI 基础设施的关键进步,承诺在各个领域提供更高的性能和效率。

通过解耦推理应对 AI 复杂性

推理,即 AI 模型解释和处理数据的过程,正在快速演变。现代 AI 系统现在需要多步骤推理和长期记忆,对其计算基础设施提出了更高要求。NVIDIA 的 Rubin CPX 旨在通过解耦基础设施方法优化推理过程,以满足这些需求。这种架构将上下文和生成阶段的推理分离,允许对资源进行有针对性的优化。

计算密集型的上下文阶段需要高通量处理来分析大量数据,而生成阶段依赖于快速的内存传输。通过独立处理这些阶段,NVIDIA 的方法提高了吞吐量、降低了延迟并改善了资源利用率。

Rubin CPX:增强长上下文处理

Rubin CPX GPU 专为长上下文 AI 任务而建,可无缝集成到现有基础设施中以提升效率和投资回报率 (ROI)。它具备 30 petaFLOPs 的 NVFP4 计算能力、128 GB 的 GDDR7 内存以及视频处理硬件支持,非常适合软件开发和视频生成等高价值应用。

Rubin CPX 与 NVIDIA Vera CPU 和 Rubin GPU 协同工作,构成复杂 AI 工作负载的综合解决方案。配备 144 台 Rubin CPX GPU、144 台 Rubin GPU 和 36 台 Vera CPU 的 NVIDIA Vera Rubin NVL144 CPX 机架提供了 8 exaFLOPs 的 NVFP4 计算能力和大量的内存带宽,性能无与伦比。

在 AI 基础设施中树立新标准

NVIDIA 的最新产品将重新定义 AI 基础设施的经济性,承诺提供可观的投资回报率。利用 NVIDIA 的 Quantum-X800 InfiniBand 和 Spectrum-X Ethernet,Vera Rubin NVL144 CPX 平台预期可实现 30 倍至 50 倍的 ROI,可能从 1 亿美元的投资中创造数十亿美元的收入。

这一创新不仅增强了 AI 的能力,还为未来在生成式 AI 应用中的发展确立了新的基准。通过在 NVIDIA Dynamo 平台上集成去耦基础设施与高级编排,Rubin CPX 为更复杂的 AI 系统铺平了道路,使其能够处理最具挑战性的推理任务。

欲了解更多详情,请访问 NVIDIA 博客

Image source: Shutterstock