NVIDIA XANI 将 X 射线数据处理时间缩短至数小时
realtime news May 13, 2026 17:39
NVIDIA 的 XANI 工作流程使用 Grace Blackwell 超级芯片将纳米级成像数据分析时间从 9 个月缩短到不到 4 小时。
NVIDIA 推出了其加速 X 射线分析纳米级成像 (XANI) 工作流程的重大突破。借助 Grace Blackwell 超级芯片,该公司将 X 射线自由电子激光 (XFEL) 设施的数据处理时间从 9 个月缩短到不到 4 小时——提升超过 1,000 倍。
像美国的 LCLS-II 和德国的欧洲 XFEL 这样的 XFEL 设施,在探测半导体、电池和催化剂等先进材料的原子和电子动态时会生成巨大的数据集。这些设施每秒产生高达 100 万个 X 射线脉冲,实时捕捉原子层面的结构变化。然而,分析由此产生的多维数据的数十 TB 数据量一直是计算瓶颈。
NVIDIA 的 XANI 解决方案利用 GB200 Grace Blackwell 超级芯片加速了这一过程。通过结合基于 GPU 的处理、CUDA Python 和分布式计算,团队在保持精度的同时将 42 TB 数据的分析时间压缩至不到 4 小时。这与传统基于 CPU 的工作流程形成鲜明对比,后者在实验中通常只能处理数据集的 10%。
XANI 的关键创新
支持 XANI 性能的多项技术进步包括:
- GPU 加速:与之前基于 CPU 的方法相比,XANI 在单个 GPU 上实现了 43 倍的加速,在 64 个 GPU 上实现了 1,000 倍的提升。
- cuPyNumeric 库:诸如 LMFIT 和多线程 HDF5 等新库提高了 GPU 利用率,实现了 165 倍更快的 I/O 吞吐量。
- GPUDirect 存储 (GDS):通过将数据直接加载到 GPU 内存中,XANI 避开了 CPU 瓶颈,在 16 个 Grace Blackwell 节点上实现高达 700GB/s 的读取速度。
此工作流程还引入了一种分布式内存架构,简化了科学计算。通过将 NumPy 导入替换为 cuPyNumeric,研究人员无需编写复杂的 MPI 代码即可自动并行化集群操作。这让 XANI 不仅适用于物理学,还可以扩展到材料化学和量子计算等领域。
为下一代研究扩展
XANI 架构旨在实现可扩展性。通过其以 GPU 为中心的分布式模型,科学家现在可以实时分析数据,在实验期间提供实时反馈。这种能力可能会重新定义 XFEL 设施的运行方式,减少从数据收集到可操作见解之间的延迟。
由于非线性最小二乘算法和批量 GPU 计算的进步,XANI 可以处理精确到像素级的高分辨率成像数据。该工作流程能够并行地将阻尼振荡拟合到探测器数据,确保比以往更快更精确的结果。
对科学发现的影响
NVIDIA 的 XANI 工作流程代表了科学研究中高性能计算的范式转变。将分析时间从数月缩短至数小时,它加速了材料科学、量子物理等领域的发现。全球的 XFEL 设施现在可以从这些效率中受益,为实时实验开启新的可能性。
对研究人员来说,意义显而易见:像 Grace Blackwell 超级芯片这样的先进 GPU 系统正成为解决现代科学数据挑战的必备工具。
Image source: Shutterstock