NVIDIA XANI 将 X 射线数据处理时间缩短至数小时

NVIDIA 推出了其加速 X 射线分析纳米级成像 (XANI) 工作流程的重大突破。借助 Grace Blackwell 超级芯片，该公司将 X 射线自由电子激光 (XFEL) 设施的数据处理时间从 9 个月缩短到不到 4 小时——提升超过 1,000 倍。

像美国的 LCLS-II 和德国的欧洲 XFEL 这样的 XFEL 设施，在探测半导体、电池和催化剂等先进材料的原子和电子动态时会生成巨大的数据集。这些设施每秒产生高达 100 万个 X 射线脉冲，实时捕捉原子层面的结构变化。然而，分析由此产生的多维数据的数十 TB 数据量一直是计算瓶颈。

NVIDIA 的 XANI 解决方案利用 GB200 Grace Blackwell 超级芯片加速了这一过程。通过结合基于 GPU 的处理、CUDA Python 和分布式计算，团队在保持精度的同时将 42 TB 数据的分析时间压缩至不到 4 小时。这与传统基于 CPU 的工作流程形成鲜明对比，后者在实验中通常只能处理数据集的 10%。

XANI 的关键创新

支持 XANI 性能的多项技术进步包括：

GPU 加速：与之前基于 CPU 的方法相比，XANI 在单个 GPU 上实现了 43 倍的加速，在 64 个 GPU 上实现了 1,000 倍的提升。
cuPyNumeric 库：诸如 LMFIT 和多线程 HDF5 等新库提高了 GPU 利用率，实现了 165 倍更快的 I/O 吞吐量。
GPUDirect 存储 (GDS)：通过将数据直接加载到 GPU 内存中，XANI 避开了 CPU 瓶颈，在 16 个 Grace Blackwell 节点上实现高达 700GB/s 的读取速度。

此工作流程还引入了一种分布式内存架构，简化了科学计算。通过将 NumPy 导入替换为 cuPyNumeric，研究人员无需编写复杂的 MPI 代码即可自动并行化集群操作。这让 XANI 不仅适用于物理学，还可以扩展到材料化学和量子计算等领域。

为下一代研究扩展

XANI 架构旨在实现可扩展性。通过其以 GPU 为中心的分布式模型，科学家现在可以实时分析数据，在实验期间提供实时反馈。这种能力可能会重新定义 XFEL 设施的运行方式，减少从数据收集到可操作见解之间的延迟。

由于非线性最小二乘算法和批量 GPU 计算的进步，XANI 可以处理精确到像素级的高分辨率成像数据。该工作流程能够并行地将阻尼振荡拟合到探测器数据，确保比以往更快更精确的结果。

对科学发现的影响

NVIDIA 的 XANI 工作流程代表了科学研究中高性能计算的范式转变。将分析时间从数月缩短至数小时，它加速了材料科学、量子物理等领域的发现。全球的 XFEL 设施现在可以从这些效率中受益，为实时实验开启新的可能性。

对研究人员来说，意义显而易见：像 Grace Blackwell 超级芯片这样的先进 GPU 系统正成为解决现代科学数据挑战的必备工具。

Image source: Shutterstock

Bookmark

NVIDIA XANI 将 X 射线数据处理时间缩短至数小时

XANI 的关键创新

为下一代研究扩展

对科学发现的影响

Premium Sponsors

Flash News