NVIDIA 的 RAPIDS-singlecell 革命性地改变了生物学中的十亿细胞数据分析
realtime news Jun 12, 2025 07:46
NVIDIA 的 RAPIDS-singlecell 工具解决了单细胞生物学中数据大小和分析速度的挑战,通过 GPU 加速革命性地推动了十亿细胞数据集的研究。

NVIDIA 的 RAPIDS-singlecell 工具旨在通过解决单细胞数据分析中的两个主要挑战:数据大小和分析速度,来改变细胞生物学的格局。随着单细胞实验从数百个细胞扩展到数十亿个细胞,对高效数据处理解决方案的需求变得至关重要,依据 NVIDIA 开发者博客 所述。
加速生物学发现
RAPIDS-singlecell 是由 scverse 开发的开源工具,通过 CuPy 和 NVIDIA RAPIDS 利用 GPU 加速来大幅提升数据处理能力。该工具使用 AnnData 数据结构,这是科学界的标准,能够与现有工作流程无缝集成。
该工具处理大型数据集的能力对于推进生物学研究至关重要,包括新疗法的发现和了解疾病进展。它与 NVIDIA 的 CUDA 库、cuML、cuGraph 和 Dask 的集成允许在多个 GPU 上并行执行,大大缩短了分析时间,从数小时减少到几秒钟。
实际应用和基准测试
像 Noetik 这样的公司已经从 RAPIDS-singlecell 中受益。Noetik 的基础模型 OCTO-vc 利用这项技术模拟数十亿个虚拟细胞,这是在没有加速计算的情况下无法实现的壮举。Noetik 的首席科学官 Jacob Rinaldi 强调了该工具能够将分析过程加速数百倍,从而实现近乎实时的结果。
基准测试展示了 RAPIDS-singlecell 的效率,如 UMAP 和 Leiden 聚类等任务的速度分别提高了 470 倍和 1958 倍,与传统的 CPU 方法相比。对于处理日益复杂和规模增大的单细胞数据,这些改进至关重要。
未来前景和集成
细胞科学的未来取决于是否能够在单一节点上对数百万细胞进行分析。RAPIDS-singlecell 的最新进展包括对 NVIDIA Blackwell GPU 的支持,进一步缩短了分析时间并促进了对细胞群体的实时探索。
此外,RAPIDS-singlecell 中对 Harmony 一种批处理集成工具的集成,允许消除批量效应,提高从大数据集得出的生物学见解的质量。这种集成尤其重要,因为来自 CZI cellxgene 和 Arc 的虚拟细胞图集等存储库的数据集在规模和复杂性方面不断增长。
通过提供一个强大的单细胞分析平台,NVIDIA 的 RAPIDS-singlecell 准备推动生物学研究的重大进展,为科学家提供所需工具,以解锁新见解并在医学中开发创新解决方案。
Image source: Shutterstock