predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info
NVIDIA 在代理 AI 领域以 GB300 NVL72 性能设定新基准 - Blockchain.News

NVIDIA 在代理 AI 领域以 GB300 NVL72 性能设定新基准

realtime news Jun 12, 2026 22:01

NVIDIA 的 GB300 NVL72 GPU 在代理编码中实现了 20 倍的效率提升,通过 AA-AgentPerf 设定了新的 AI 基准标准。

NVIDIA 在代理 AI 领域以 GB300 NVL72 性能设定新基准

NVIDIA (NASDAQ: NVDA) 在定义代理 AI 工作负载的性能标准方面迈出了重要一步。该公司宣布,其全新 GB300 NVL72 GPU 在代理编码任务中比上一代 H200 芯片的效率提高了多达 20 倍。这一成就是基于首个行业范围的标准 AA-AgentPerf 基准测试得出的,该基准测试用于评估处理自主 AI 代理的推理系统。

代理 AI 是指为长期运行的自主任务设计的系统,例如能够导航大型数据集、调用工具并自主生成软件的编码代理。迄今为止,行业一直缺乏一种一致的方法来衡量这些复杂工作负载的性能。AA-AgentPerf 填补了这一空白,通过评估推理系统在满足严格的服务级别目标(SLOs)下生成令牌速度和延迟的情况下能够支持的并发 AI 代理数量。

数据说明了什么

根据基准测试,NVIDIA 的 GB300 NVL72 每兆瓦支持 61,400 个并发代理,相比 H200 的 2,600 个代理是一个巨大的飞跃。在硬件效率方面,GB300 NVL72 每块 GPU 能支持 57.5 个代理,而其前代产品仅为 1.4 个代理。这些指标突显了 NVIDIA 的极端协同设计方法的影响,即硬件与软件针对特定工作负载进行了优化配合。

基准测试还对 NVIDIA 的 DeepSeek-V4-Pro 模型在三个 SLO 等级上进行了测试。在最高等级下,该等级要求每秒生成 300 个令牌且最大延迟为三秒,GB300 NVL72 保持了其性能优势,证明了其处理真实世界编码代理需求的能力。

为什么重要

NVIDIA 在代理 AI 领域的主导地位并非偶然。其战略围绕着掌控完整的 AI 堆栈展开——从 GPU 和 CPU(如最近发布的 Vera CPU)到模型和评估框架。本月早些时候,CEO 黄仁勋将代理 AI 描述为从“生成文本的 AI 转变为执行行动的 AI”。这与 NVIDIA 推动支持编码代理和需要长时间会话及复杂工具编排的企业工作流的目标一致。

GB300 NVL72 的性能突显了 NVIDIA 在大规模满足这一需求的能力。对于企业来说,每瓦部署更多并发代理的能力转化为更低的基础设施成本和更高的效率。对于数据中心来说,基准测试结果为容量规划提供了重要见解,尤其是在工作负载向这些长上下文、多步骤应用转变的情况下。

更大的格局

这一发布巩固了 NVIDIA 在硬件、软件和基准测试日益交织的市场中的领先地位。与之同时宣布的 Vera Rubin 平台承诺通过集成下一代功能(如 NVFP4 计算用于低精度推理和工具调用的 CPU 加速)进一步扩大这些收益。Vera Rubin 预计将于今年晚些时候推出,以进一步优化代理工作流。

对于投资者而言,NVIDIA 对代理 AI 的关注代表了一个有利可图的增长路径。截至 2026 年 6 月 12 日,该公司股票交易价格为 205.19 美元,反映了市场对其推动下一波 AI 创新的能力的信心。随着代理 AI 市场仍处于早期阶段,NVIDIA 的全面堆栈使其能够抓住企业和云服务提供商日益增长的需求。

随着企业越来越多地采用 AI 代理进行编码和其他自主任务,像 AA-AgentPerf 这样的基准测试将对塑造行业对性能和效率的理解至关重要。NVIDIA 在这一领域的领导地位确保了其在这一快速发展的领域中保持前沿地位。

Image source: Shutterstock