NVIDIA 的 cuVS 提升了 Faiss 向量搜索效率,利用 GPU 加速 - Blockchain.News

NVIDIA 的 cuVS 提升了 Faiss 向量搜索效率,利用 GPU 加速

realtime news Nov 07, 2025 04:23

NVIDIA 的 cuVS 与 Faiss 的集成增强了 GPU 加速的向量搜索,提供更快的索引构建和更低的搜索延迟,这对于管理大规模数据集至关重要。

NVIDIA 的 cuVS 提升了 Faiss 向量搜索效率,利用 GPU 加速

随着处理大规模非结构化数据的需求增长,NVIDIA 通过其 cuVS 技术与 Meta Faiss 库的集成,推出了向量搜索能力的显著增强。根据NVIDIA 的博客,这一集成在使用大型语言模型(LLM)的环境中,提供了显著的性能和效率提升。

增强向量搜索的需求

随着 LLM 的兴起和非结构化数据量的增加,企业正在寻求更快、更具扩展性的系统。传统的基于 CPU 的系统难以满足广告推荐等应用的实时需求,常常需要数千个 CPU,这大大增加了基础设施成本。

cuVS 与 Faiss 的集成

NVIDIA 的 cuVS 利用 GPU 加速增强了 Faiss 库,该库以高效的相似性搜索和密集向量的聚类而闻名。这一集成加快了搜索索引的创建和搜索过程本身,提供了一种更具成本效益和效率的解决方案。集成支持 CPU 与 GPU 之间的无缝兼容,允许灵活的部署选项。

性能提升

通过将 cuVS 集成到 Faiss 中,用户可以在 GPU 上体验高达 12 倍的索引构建速度,同时保持 95% 的召回率。搜索延迟可以减少高达 8 倍,从而显著提高速度和效率。集成还允许在 GPU 和 CPU 环境之间轻松转换索引,以适应各种部署需求。

基准测试和结果

在 Deep100M 和 OpenAI 文本嵌入等数据集上进行的性能基准测试显示,索引构建时间和搜索延迟都得到了显著改善。在 NVIDIA 的 H100 Tensor Core GPU 和英特尔 Xeon Platinum CPU 上进行的测试表明,增强的 cuVS Faiss 超过了传统方法,特别是在处理大型批处理和在线搜索任务时表现出色。

基于图的索引和互操作性

NVIDIA 的 CAGRA 是一种针对 GPU 优化的基于图的索引,与基于 CPU 的 HNSW 相比,具有显著的优势,包括高达 12.3 倍的构建时间和 4.7 倍的搜索延迟。这使其成为高容量推理任务的理想选择。CAGRA 可以转换为适用于基于 CPU 搜索的 HNSW 格式,从而允许结合 CPU 和 GPU 处理优点的混合部署方法。

结论

NVIDIA 的 cuVS 与 Faiss 的集成代表了向量搜索领域的重大进展,为管理非结构化数据处理的日益增长需求提供了重要工具。通过提供更快的索引构建和减少的搜索延迟,这一集成使组织能够更有效地处理大规模数据,促进新模型的快速实验和部署。

对于那些有兴趣探索这些功能的人来说,faiss-gpu-cuvs 软件包可以安装,提供全面的文档和示例笔记本,以指导用户完成整个过程。

Image source: Shutterstock