NVIDIA 与 Mistral AI 公布先进的开源 AI 模型

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

NVIDIA 与 Mistral AI 公布先进的开源 AI 模型 - Blockchain.News

据 NVIDIA 报道，NVIDIA 宣布与 Mistral AI 建立战略合作伙伴关系，专注于开发 Mistral 3 系列的开源模型。这次合作旨在优化这些模型，以应用于 NVIDIA 的超级计算和边缘平台。

通过效率和可伸缩性变革 AI

Mistral 3 模型旨在为企业 AI 应用提供前所未有的效率和可伸缩性。核心模型 Mistral Large 3 采用专家模型（MoE）架构，该架构选择性地激活神经元以提高效率和准确性。该模型拥有 410 亿个活跃参数，总计 6750 亿个参数，并提供 256K 的上下文窗口，以处理复杂的 AI 任务。

与 NVIDIA 先进系统的整合

通过结合使用 NVIDIA 的 GB200 NVL72 系统和 Mistral AI 的 MoE 架构，企业可以有效地部署和扩展大规模 AI 模型。这种合作推动了先进的并行性和硬件优化，弥合了研究突破与实际应用之间的差距，Mistral AI 将其称为‘分布式智能’。

利用尖端科技提升性能

Mistral Large 3 的 MoE 架构利用了 NVIDIA NVLink 的一致性内存域，并采用广域专家并行优化。这些增强措施由保持精度的低精度 NVFP4 和 NVIDIA Dynamo 的分散推理优化所补充，确保大规模训练和推理的最高性能。在 GB200 NVL72 上，Mistral Large 3 相较于前代 NVIDIA H200 系统实现了十倍的性能提升。

扩大 AI 的可及性

Mistral AI 通过推出九个更小的语言模型，展示了其对民主化 AI 技术的承诺，旨在促进 AI 在包括 NVIDIA Spark、RTX 计算机、笔记本电脑和 Jetson 设备在内的各种平台上的应用。为边缘平台优化的 Ministral 3 系列，支持通过 Llama.cpp 和 Ollama 等框架快速高效地执行 AI。

在 AI 框架上的合作

NVIDIA 的合作范围延伸至顶尖的 AI 框架，如 Llama.cpp 和 Ollama，支持在边缘设备上使用 NVIDIA GPU 实现最佳性能。开发者和爱好者可以访问 Ministral 3 系列，用于边缘设备上的高效 AI 应用，模型也向外开放以供实验和自定义。

未来前景与可用性

Mistral 3 模型在领先的开源平台和云服务提供商上可用，未来将作为 NVIDIA NIM 微服务进行部署。这一战略合作突显了 NVIDIA 和 Mistral AI 在推动 AI 技术发展方面的承诺，使其在不同行业中的应用变得可及且实用。

Image source: Shutterstock

Bookmark