NVIDIA 发布带有企业 RAG 蓝图的安全 AI 代理 - Blockchain.News

NVIDIA 发布带有企业 RAG 蓝图的安全 AI 代理

realtime news Nov 25, 2025 04:54

NVIDIA 推出 AI-Q Research Assistant 和 Enterprise RAG Blueprints,以增强数据驱动的 AI 代理的能力,利用 AWS 基础设施实现安全和可扩展的部署。

NVIDIA 发布带有企业 RAG 蓝图的安全 AI 代理

为了增强生成式 AI 的能力,NVIDIA 推出了 AI-Q Research Assistant 和企业 RAG 蓝图。这些高级工具旨在创建不仅准确可靠而且针对企业特定数据需求量身定制的 AI 代理,据 NVIDIA 称

通过检索增强生成提升 AI

这一创新的核心在于使用检索增强生成(RAG)和 NVIDIA Nemotron 推理 AI 模型。这些技术自动化文档理解,提取有价值的见解,并促进从大规模数据集中生成高价值报告。这种方法对于希望利用 AI 做出更明智决策和数据分析的组织尤其有利。

在 AWS 上的基础设施和部署

部署这些 AI 代理需要一个不仅安全而且可扩展的强大基础设施。NVIDIA 的蓝图经过优化,可以在 Amazon Web Services (AWS) 上进行部署,使用 Amazon Elastic Kubernetes Service (EKS) 进行编排。此设置确保 AI 代理可以在最大化成本效益的同时高效运行。基础设施还集成了 Amazon OpenSearch Serverless 用于矢量数据库管理,Amazon Simple Storage Service (S3) 用于数据存储,以及 Karpenter 用于动态 GPU 扩展。

蓝图组件和架构

AI-Q Research Assistant 建立在企业 RAG 蓝图基础之上,作为基础组件。这些蓝图由 NVIDIA NIM 微服务组成,经过优化以在 GPU 上实现高吞吐量、低延迟的 AI 模型性能。关键组件包括大语言模型(LLM),如 Llama-3.3-Nemotron-Super-49B-v1.5,以及 NeMo Retriever 模型,用于高级数据检索能力。

架构旨在将这些组件作为 pod 部署在 Kubernetes 集群中。此设置允许 GPU 实例的动态供应,优化性能和成本。

AI-Q Research Assistant 工作流程

AI-Q 蓝图通过集成复杂的代理工作流程来增强 RAG 基础。此工作流程包括计划、精炼和反思阶段,使 AI 代理能够根据实时数据和现有企业知识生成综合报告。通过 Tavily API 集成的网络搜索功能确保报告基于最新的可用信息。

结论

NVIDIA 引入 AI-Q Research Assistant 和企业 RAG 蓝图标志着数据驱动 AI 代理开发的重大进步。通过利用 AWS 基础设施,这些解决方案为部署可将企业数据转化为可操作见解的 AI 应用提供了安全和可扩展的环境。组织现在可以在 Amazon EKS 上部署这些蓝图,以增强其数据处理和决策能力。

Image source: Shutterstock