NVIDIA的AI-Q为代理工具带来深度研究能力
realtime news May 21, 2026 19:06
NVIDIA AI-Q为代理工具(如Codex和LangChain)引入了一项专业的深度研究技能,简化了企业数据任务。
NVIDIA发布了一项专为代理工具(如Claude Code、Codex和LangChain Deep Agents)设计的深度研究能力。该功能被称为AI-Q,这是一种开源的研究蓝图,旨在处理复杂的企业数据任务,使代理能够生成结构化的带有引用的报告,同时确保敏感数据保持在受监管的环境中。AI-Q于2026年5月20日发布,有望成为需要高合规性行业的重要工具,例如医疗、金融和国防。
代理工具已经擅长于执行任务编排、代码执行等功能,但深度研究往往将复杂性转移给开发者。AI-Q通过提供一种便携的技能改变了这种动态,该技能可以无缝集成到这些代理工具中。该技能允许代理将研究任务委派给本地或托管的AI-Q服务器,服务器处理查询并返回详细的输出,无需代理构建自定义的研究管道。
企业级设计
AI-Q的一大亮点是其能够安全地在企业环境中运行。敏感数据始终保留在受控基础设施中,因为AI-Q在本地执行数据检索、合成和分析。这对于具有严格数据主权或合规性要求的组织来说尤为有价值。该系统还能够与企业MCP(托管内容平台)服务器集成,支持包括OAuth2和服务账户在内的多种认证模式。
对于开发者而言,AI-Q的设置过程十分简单。该技能包可在NVIDIA的AI-Q GitHub存储库中获取,其中包含将研究技能连接到代理工具(如Claude Code、Codex和OpenCode)的工具。安装过程包括配置技能目录并设置AI-Q服务器,该服务器可以运行在本地、云端,甚至是使用Docker Compose或Helm图表的隔离环境中。
优化的研究管道
AI-Q的研究管道专为高质量输出而设计。它包括四个独立阶段:意图分类、人工参与澄清、快速查询的浅层研究以及复杂合成的深度研究。每个阶段都经过独立调优和基准测试,评估使用了诸如FreshQA和DeepSearchQA等已建立的数据集。这种结构化方法确保了可靠性和准确性,特别是在需要长时间分析或多文档合成的任务中。
另一个关键功能是来源归属。AI-Q生成的报告包含详细的引用,便于合规团队验证输出中使用的数据来源。OpenTelemetry跟踪进一步增强了可审计性,使组织能够追踪数据来源的查询和合成过程。
适用于受监管行业
对于具有严格监管要求的行业,AI-Q的部署能力是一大变革。企业可以自托管开源模型(如NVIDIA Nemotron),以确保合规性,同时利用基于云的模型处理需要额外计算能力的任务。这种灵活性使团队能够有效平衡成本、性能和合规需求。
AI-Q还通过了戴尔AI Factory基础设施的验证,提供适用于金融服务、制造业和公共部门应用的生产就绪部署选项。戴尔-NVIDIA AI-Q 2.0参考架构简化了将AI-Q集成到现有工作流中的过程,使其成为企业级采用的理想选择。
下一步
有兴趣利用AI-Q的团队可以通过部署服务器并将其连接到其代理工具开始。详细的设置说明可在AI-Q GitHub存储库中找到。对于企业而言,将MCP服务器连接到AI-Q可以实现与现有数据平台的无缝集成,同时确保合规性并保持运营效率。
随着AI的不断发展,像AI-Q这样的工具代表了一种更专业化和安全化的能力转变。通过将深度研究任务卸载到专用后端,代理工具可以专注于任务编排,为开发者提供简化且可扩展的企业AI解决方案。
Image source: Shutterstock