NVIDIA发布Nemotron Nano 2 9B以增强边缘AI性能

NVIDIA发布Nemotron Nano 2 9B以增强边缘AI性能 - Blockchain.News

NVIDIA推出了Nemotron Nano 2 9B，这是一款尖端模型，旨在凭借高准确性和效率提升边缘AI性能。根据Hugging Face的说法，这个新的发布是Nemotron家族的一部分，重点在于为企业级AI应用提供卓越的推理能力。

先进的混合架构

Nemotron Nano 2 9B采用混合Transformer-Mamba架构，结合两种技术的优势来优化吞吐量并保持准确性。这个设计使得模型能够比同类型号快六倍的生成标记，使其非常适合低延迟环境。其可配置的思维预算允许开发人员根据他们的具体需求调整准确性、吞吐量和成本，从而进一步提高效率。

Nemotron Nano 2 9B具有90亿个参数，专为各种应用而设计，包括客户服务、支持聊天机器人和分析辅助。其混合架构支持高吞吐量，这对于边缘的实时应用至关重要。该模型通过Hugging Face可以访问，NVIDIA计划通过NVIDIA NIM提供高吞吐量和低延迟的部署。

创新的思维预算功能允许用户限制用于推理的标记数量，可在不影响准确性的前提下，潜在减少高达60%的成本。这个功能对响应时间要求严格的应用特别有利，如客户服务聊天机器人和资源有限的边缘设备。

Nemotron Nano 2通过复杂的后训练过程开发，包括监督微调和强化学习，以确保在一系列任务上具有强大的性能。该模型还进行了压缩处理，以适应硬件限制，同时保持高吞吐量和准确性。

有兴趣利用Nemotron Nano 2 9B的开发者可以在Hugging Face上探索该模型。模型的开源性质鼓励进一步开发和定制以满足特定的企业需求。NVIDIA通过发布额外的技术资源和数据集，以支持开源社区的承诺显而易见。

Image source: Shutterstock