NEW
NVIDIA RAPIDS 通过零代码加速和性能提升增强机器学习 - Blockchain.News

NVIDIA RAPIDS 通过零代码加速和性能提升增强机器学习

realtime news May 31, 2025 06:02

NVIDIA 的 RAPIDS 引入了机器学习的零代码加速,提升了IO性能,并支持超出内存的XGBoost训练,从而简化了数据科学工作流程。

NVIDIA RAPIDS 通过零代码加速和性能提升增强机器学习

NVIDIA 在其 RAPIDS 软件套件中公布了重要进展,专注于机器学习加速和性能增强。据 NVIDIA 称,最新更新引入了Python机器学习的零代码更改加速、大幅的 IO 性能改进,并支持超出内存的XGBoost训练。

零代码更改加速

NVIDIA 的 cuML 的新功能现在允许数据科学家在工作流程中利用零代码更改加速。这一功能对于使用如 scikit-learn、UMAP 和 hdbscan 等流行库的用户特别有利。通过利用 NVIDIA GPU,数据科学家可以在不改变现有代码库的情况下获得 5-175 倍的性能提升。

IO 性能增强

RAPIDS 的 cuDF 获得了显著的性能提升,特别是针对云数据处理任务。通过集成 NVIDIA KvikIO,可以更快地从 Amazon S3 等云存储解决方案中读取 Parquet 文件,实现三倍的读取速度提升。此外,NVIDIA 的 Blackwell 架构中的硬件压缩引擎通过降低延迟和增加吞吐量来加快数据处理速度。

超出内存的 XGBoost 训练

与 DMLC 社区合作,RAPIDS 已经过优化可处理大型数据集,允许对超过内存限制的数据进行有效训练。这一发展对于使用 NVIDIA 的 GH200 Grace Hopper 和 GB200 Grace Blackwell 的系统尤其有利,能够高效处理超过 1 TB 的数据集。

可用性和平台更新

RAPIDS 还通过全球配置设置和针对 Polars 引擎的GPU感知性能分析功能等特点增强了可用性,使用户更容易优化他们的数据科学工作流程。此外,支持 NVIDIA Blackwell 架构 GPU 和 Conda 包管理的改进也已推出,扩大了平台的可访问性和易用性。

这些更新在 NVIDIA GTC 2025 上展示,强调了 NVIDIA 在推动数据科学技术进步和简化机器学习流程上的承诺。有关这些开发的更详细信息,请访问 NVIDIA 博客

Image source: Shutterstock