NVIDIA 与 Mistral AI 公布先进的开源 AI 模型
realtime news Dec 02, 2025 19:11
NVIDIA 与 Mistral AI 合作推出 Mistral 3 系列模型,提高企业平台的 AI 效率与可伸缩性。
据 NVIDIA 报道,NVIDIA 宣布与 Mistral AI 建立战略合作伙伴关系,专注于开发 Mistral 3 系列的开源模型。这次合作旨在优化这些模型,以应用于 NVIDIA 的超级计算和边缘平台。
通过效率和可伸缩性变革 AI
Mistral 3 模型旨在为企业 AI 应用提供前所未有的效率和可伸缩性。核心模型 Mistral Large 3 采用专家模型(MoE)架构,该架构选择性地激活神经元以提高效率和准确性。该模型拥有 410 亿个活跃参数,总计 6750 亿个参数,并提供 256K 的上下文窗口,以处理复杂的 AI 任务。
与 NVIDIA 先进系统的整合
通过结合使用 NVIDIA 的 GB200 NVL72 系统和 Mistral AI 的 MoE 架构,企业可以有效地部署和扩展大规模 AI 模型。这种合作推动了先进的并行性和硬件优化,弥合了研究突破与实际应用之间的差距,Mistral AI 将其称为‘分布式智能’。
利用尖端科技提升性能
Mistral Large 3 的 MoE 架构利用了 NVIDIA NVLink 的一致性内存域,并采用广域专家并行优化。这些增强措施由保持精度的低精度 NVFP4 和 NVIDIA Dynamo 的分散推理优化所补充,确保大规模训练和推理的最高性能。在 GB200 NVL72 上,Mistral Large 3 相较于前代 NVIDIA H200 系统实现了十倍的性能提升。
扩大 AI 的可及性
Mistral AI 通过推出九个更小的语言模型,展示了其对民主化 AI 技术的承诺,旨在促进 AI 在包括 NVIDIA Spark、RTX 计算机、笔记本电脑和 Jetson 设备在内的各种平台上的应用。为边缘平台优化的 Ministral 3 系列,支持通过 Llama.cpp 和 Ollama 等框架快速高效地执行 AI。
在 AI 框架上的合作
NVIDIA 的合作范围延伸至顶尖的 AI 框架,如 Llama.cpp 和 Ollama,支持在边缘设备上使用 NVIDIA GPU 实现最佳性能。开发者和爱好者可以访问 Ministral 3 系列,用于边缘设备上的高效 AI 应用,模型也向外开放以供实验和自定义。
未来前景与可用性
Mistral 3 模型在领先的开源平台和云服务提供商上可用,未来将作为 NVIDIA NIM 微服务进行部署。这一战略合作突显了 NVIDIA 和 Mistral AI 在推动 AI 技术发展方面的承诺,使其在不同行业中的应用变得可及且实用。
Image source: Shutterstock