NVIDIA 的 cuVS 提升了 Faiss 向量搜索效率，利用 GPU 加速

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

NVIDIA 的 cuVS 提升了 Faiss 向量搜索效率，利用 GPU 加速 - Blockchain.News

随着处理大规模非结构化数据的需求增长，NVIDIA 通过其 cuVS 技术与 Meta Faiss 库的集成，推出了向量搜索能力的显著增强。根据NVIDIA 的博客，这一集成在使用大型语言模型（LLM）的环境中，提供了显著的性能和效率提升。

增强向量搜索的需求

随着 LLM 的兴起和非结构化数据量的增加，企业正在寻求更快、更具扩展性的系统。传统的基于 CPU 的系统难以满足广告推荐等应用的实时需求，常常需要数千个 CPU，这大大增加了基础设施成本。

cuVS 与 Faiss 的集成

NVIDIA 的 cuVS 利用 GPU 加速增强了 Faiss 库，该库以高效的相似性搜索和密集向量的聚类而闻名。这一集成加快了搜索索引的创建和搜索过程本身，提供了一种更具成本效益和效率的解决方案。集成支持 CPU 与 GPU 之间的无缝兼容，允许灵活的部署选项。

性能提升

通过将 cuVS 集成到 Faiss 中，用户可以在 GPU 上体验高达 12 倍的索引构建速度，同时保持 95% 的召回率。搜索延迟可以减少高达 8 倍，从而显著提高速度和效率。集成还允许在 GPU 和 CPU 环境之间轻松转换索引，以适应各种部署需求。

基准测试和结果

在 Deep100M 和 OpenAI 文本嵌入等数据集上进行的性能基准测试显示，索引构建时间和搜索延迟都得到了显著改善。在 NVIDIA 的 H100 Tensor Core GPU 和英特尔 Xeon Platinum CPU 上进行的测试表明，增强的 cuVS Faiss 超过了传统方法，特别是在处理大型批处理和在线搜索任务时表现出色。

基于图的索引和互操作性

NVIDIA 的 CAGRA 是一种针对 GPU 优化的基于图的索引，与基于 CPU 的 HNSW 相比，具有显著的优势，包括高达 12.3 倍的构建时间和 4.7 倍的搜索延迟。这使其成为高容量推理任务的理想选择。CAGRA 可以转换为适用于基于 CPU 搜索的 HNSW 格式，从而允许结合 CPU 和 GPU 处理优点的混合部署方法。

结论

NVIDIA 的 cuVS 与 Faiss 的集成代表了向量搜索领域的重大进展，为管理非结构化数据处理的日益增长需求提供了重要工具。通过提供更快的索引构建和减少的搜索延迟，这一集成使组织能够更有效地处理大规模数据，促进新模型的快速实验和部署。

对于那些有兴趣探索这些功能的人来说，faiss-gpu-cuvs 软件包可以安装，提供全面的文档和示例笔记本，以指导用户完成整个过程。

Image source: Shutterstock

Bookmark