Place your ads here email us at info@blockchain.news
NEW
NVIDIA 的 GB200 NVL72 提升了 UC Berkeley 的 LMArena 的 AI 模型评估 - Blockchain.News

NVIDIA 的 GB200 NVL72 提升了 UC Berkeley 的 LMArena 的 AI 模型评估

realtime news Jun 18, 2025 15:57

UC Berkeley 的 LMArena 利用 NVIDIA 的 GB200 NVL72 提升 AI 模型评估,这要归功于与 NVIDIA 和 Nebius 的合作,提高了大型语言模型的排名。

NVIDIA 的 GB200 NVL72 提升了 UC Berkeley 的 LMArena 的 AI 模型评估

根据 NVIDIA 的报道,加州大学伯克利分校的研究计划 LMArena 在 NVIDIA 的 GB200 NVL72 系统的帮助下,极大提升了评估大型语言模型(LLM)的能力。与 Nebius 的合作使 LMArena 能够改进其模型排名能力,提供关于哪些大型语言模型在数学、编程和创意写作等特定任务中表现出色的见解。

具有 P2L 的模型评估提升

LMArena 进步的核心在于 Prompt-to-Leaderboard (P2L) 模型,该模型收集人类投票以确定在各种领域表现最佳的 AI。据 LMArena 的联合创始人兼伯克利大学的博士生 Wei-Lin Chiang 称,该过程涉及将 Bradley-Terry 系数应用于用户偏好。这有助于识别在特定任务中最有效的模型,提供超越单一整体分数的细腻理解。

LMArena 与 NVIDIA DGX Cloud 和 Nebius AI Cloud 的合作对于大规模部署 P2L 至关重要。使用 NVIDIA 的 GB200 NVL72 使得云端可扩展、生产就绪的 AI 工作负载成为可能。这一合作促进了快速反馈和共同学习的循环,提升了 P2L 和 DGX Cloud 平台。

技术进步和部署

在二月,LMArena 成功在 Nebius 通过 NVIDIA DGX Cloud 托管的 NVIDIA GB200 NVL72 上部署了 P2L。这一部署由 NVIDIA 和 Nebius 开发的共享沙箱环境促进,使早期采用者能够高效测试 NVIDIA Blackwell 平台。

GB200 NVL72 平台整合了 36 个 Grace CPU 和 72 个 Blackwell GPU,提供高带宽、低延迟性能,具备多达 30 TB 的快速统一内存。该基础设施支持要求苛刻的 AI 任务,并促进资源的有效分配。

开源支持

DGX Cloud 团队与 Nebius 和 LMArena 合作,为目标 GB200 NVL72 的开源开发者确保了一个无缝的部署过程。这涉及针对 Arm64 和 CUDA 环境编译和优化关键 AI 框架,如 PyTorch 和 Hugging Face Transformers。

这一全面支持使开发者能够无兼容性问题地利用最先进的工具,专注于产品构建而非库移植。项目展示了令人印象深刻的性能改进,训练运行显著快于以前的配置。

有关合作和技术进步的详细信息,请访问 NVIDIA 博客

Image source: Shutterstock
Place your ads here email us at info@blockchain.news