小型语言模型在推动代理AI中的角色

小型语言模型在推动代理AI中的角色 - Blockchain.News

根据最近的一篇NVIDIA博客文章，代理AI的快速演变正在重塑企业运营，尤其是在自动化和数字生产力方面。虽然大型语言模型（LLM）传统上一直是AI代理的支柱，但重点正在转向小型语言模型（SLM），因其在处理特定任务时具有成本效益和高效性。

小型语言模型的优势

SLM通过利用语言处理能力的狭窄片段来完成专门任务，提供了一种LLM的切实可行的替代方案。这些模型在解析命令、生成结构化输出和回答上下文问题方面表现出色。通过为特定的代理程序优化SLM，企业能够以比LLM关联成本低得多的花费，获得更快更可靠的结果。

SLM不仅仅是LLM的缩小版；它们通常在针对性的基准测试中，如常识推理和工具调用等方面表现优异。例如，NVIDIA的Nemotron Nano 2在较低的内存使用情况下展示了较高的性能，与同类产品相比，具有更高的准确性和吞吐量。

SLM在代理AI系统中的整合并没有让LLM过时。相反，一种异构的AI架构正在出现，其中SLM负责常规子任务，而LLM则保留用于复杂的、开放式挑战。这种模块化方法与复杂问题的分解相一致，提高了AI部署的效率和可靠性。

尽管SLM具有优势，但由于认知和文化障碍，许多组织仍然主要依赖LLM。转向SLM支持的架构需要在思维方式上和为响应代理工作负载量身定制的评估标准上发生转变。随着SLM优势的显现，预计它们的采用将会增加，这反映了过去的技术转变，如向云微服务的转变。

企业可以通过分析代理使用数据以识别重复的任务，然后优化模型以专注于这些方面来整合SLM。NVIDIA的NeMo框架支持这一转变，提供工具以定制、评估和优化AI系统。这一转变使更多的组织能够参与开发代理AI，促进各行业的创新。

总之，在异构AI系统中战略性地使用SLM，为企业实现可扩展的、具成本效益和高效的自动化提供了路径。通过利用SLM和LLM的优势，组织可以增强其运营能力，并在快速发展的AI领域保持竞争力。

Image source: Shutterstock