NVIDIA的AI-Q为代理工具带来深度研究能力

NVIDIA发布了一项专为代理工具（如Claude Code、Codex和LangChain Deep Agents）设计的深度研究能力。该功能被称为AI-Q，这是一种开源的研究蓝图，旨在处理复杂的企业数据任务，使代理能够生成结构化的带有引用的报告，同时确保敏感数据保持在受监管的环境中。AI-Q于2026年5月20日发布，有望成为需要高合规性行业的重要工具，例如医疗、金融和国防。

代理工具已经擅长于执行任务编排、代码执行等功能，但深度研究往往将复杂性转移给开发者。AI-Q通过提供一种便携的技能改变了这种动态，该技能可以无缝集成到这些代理工具中。该技能允许代理将研究任务委派给本地或托管的AI-Q服务器，服务器处理查询并返回详细的输出，无需代理构建自定义的研究管道。

企业级设计

AI-Q的一大亮点是其能够安全地在企业环境中运行。敏感数据始终保留在受控基础设施中，因为AI-Q在本地执行数据检索、合成和分析。这对于具有严格数据主权或合规性要求的组织来说尤为有价值。该系统还能够与企业MCP（托管内容平台）服务器集成，支持包括OAuth2和服务账户在内的多种认证模式。

对于开发者而言，AI-Q的设置过程十分简单。该技能包可在NVIDIA的AI-Q GitHub存储库中获取，其中包含将研究技能连接到代理工具（如Claude Code、Codex和OpenCode）的工具。安装过程包括配置技能目录并设置AI-Q服务器，该服务器可以运行在本地、云端，甚至是使用Docker Compose或Helm图表的隔离环境中。

优化的研究管道

AI-Q的研究管道专为高质量输出而设计。它包括四个独立阶段：意图分类、人工参与澄清、快速查询的浅层研究以及复杂合成的深度研究。每个阶段都经过独立调优和基准测试，评估使用了诸如FreshQA和DeepSearchQA等已建立的数据集。这种结构化方法确保了可靠性和准确性，特别是在需要长时间分析或多文档合成的任务中。

另一个关键功能是来源归属。AI-Q生成的报告包含详细的引用，便于合规团队验证输出中使用的数据来源。OpenTelemetry跟踪进一步增强了可审计性，使组织能够追踪数据来源的查询和合成过程。

适用于受监管行业

对于具有严格监管要求的行业，AI-Q的部署能力是一大变革。企业可以自托管开源模型（如NVIDIA Nemotron），以确保合规性，同时利用基于云的模型处理需要额外计算能力的任务。这种灵活性使团队能够有效平衡成本、性能和合规需求。

AI-Q还通过了戴尔AI Factory基础设施的验证，提供适用于金融服务、制造业和公共部门应用的生产就绪部署选项。戴尔-NVIDIA AI-Q 2.0参考架构简化了将AI-Q集成到现有工作流中的过程，使其成为企业级采用的理想选择。

下一步

有兴趣利用AI-Q的团队可以通过部署服务器并将其连接到其代理工具开始。详细的设置说明可在AI-Q GitHub存储库中找到。对于企业而言，将MCP服务器连接到AI-Q可以实现与现有数据平台的无缝集成，同时确保合规性并保持运营效率。

随着AI的不断发展，像AI-Q这样的工具代表了一种更专业化和安全化的能力转变。通过将深度研究任务卸载到专用后端，代理工具可以专注于任务编排，为开发者提供简化且可扩展的企业AI解决方案。

Image source: Shutterstock

Bookmark

NVIDIA的AI-Q为代理工具带来深度研究能力

企业级设计

优化的研究管道

适用于受监管行业

下一步

Premium Sponsors

Flash News