NVIDIA 的 GB200 NVL72 提升了 UC Berkeley 的 LMArena 的 AI 模型评估

NVIDIA 的 GB200 NVL72 提升了 UC Berkeley 的 LMArena 的 AI 模型评估 - Blockchain.News

根据 NVIDIA 的报道，加州大学伯克利分校的研究计划 LMArena 在 NVIDIA 的 GB200 NVL72 系统的帮助下，极大提升了评估大型语言模型（LLM）的能力。与 Nebius 的合作使 LMArena 能够改进其模型排名能力，提供关于哪些大型语言模型在数学、编程和创意写作等特定任务中表现出色的见解。

具有 P2L 的模型评估提升

LMArena 进步的核心在于 Prompt-to-Leaderboard (P2L) 模型，该模型收集人类投票以确定在各种领域表现最佳的 AI。据 LMArena 的联合创始人兼伯克利大学的博士生 Wei-Lin Chiang 称，该过程涉及将 Bradley-Terry 系数应用于用户偏好。这有助于识别在特定任务中最有效的模型，提供超越单一整体分数的细腻理解。

LMArena 与 NVIDIA DGX Cloud 和 Nebius AI Cloud 的合作对于大规模部署 P2L 至关重要。使用 NVIDIA 的 GB200 NVL72 使得云端可扩展、生产就绪的 AI 工作负载成为可能。这一合作促进了快速反馈和共同学习的循环，提升了 P2L 和 DGX Cloud 平台。

技术进步和部署

在二月，LMArena 成功在 Nebius 通过 NVIDIA DGX Cloud 托管的 NVIDIA GB200 NVL72 上部署了 P2L。这一部署由 NVIDIA 和 Nebius 开发的共享沙箱环境促进，使早期采用者能够高效测试 NVIDIA Blackwell 平台。

GB200 NVL72 平台整合了 36 个 Grace CPU 和 72 个 Blackwell GPU，提供高带宽、低延迟性能，具备多达 30 TB 的快速统一内存。该基础设施支持要求苛刻的 AI 任务，并促进资源的有效分配。

开源支持

DGX Cloud 团队与 Nebius 和 LMArena 合作，为目标 GB200 NVL72 的开源开发者确保了一个无缝的部署过程。这涉及针对 Arm64 和 CUDA 环境编译和优化关键 AI 框架，如 PyTorch 和 Hugging Face Transformers。

这一全面支持使开发者能够无兼容性问题地利用最先进的工具，专注于产品构建而非库移植。项目展示了令人印象深刻的性能改进，训练运行显著快于以前的配置。

有关合作和技术进步的详细信息，请访问 NVIDIA 博客。

Image source: Shutterstock

NVIDIA 的 GB200 NVL72 提升了 UC Berkeley 的 LMArena 的 AI 模型评估

具有 P2L 的模型评估提升

技术进步和部署

开源支持

Premium Sponsors

Flash News