NVIDIA 使用 Nsight 工具优化 Omniverse NuRec 流程
realtime news Jun 30, 2026 16:42
NVIDIA 利用 Nsight Systems 和 Compute 工具,将其神经重建流程优化了 50 倍,提升了 AI 和机器人仿真的性能。
NVIDIA 宣布对其 Omniverse NuRec 神经重建流程进行了重大性能改进,这是一项关键技术,用于从多传感器数据创建高保真度的真实世界环境仿真。通过 Nsight 开发工具,NVIDIA 在核心处理任务上实现了近 50 倍的速度提升,这一突破增强了 NuRec 在自动驾驶汽车(AV)、机器人和 AI 训练工作流中的可用性。
NuRec 集成了先进的神经渲染技术,如 3D 高斯点云渲染,将来自摄像头和激光雷达的传感器数据转化为逼真的 3D 环境。这些环境对于训练和验证物理 AI 系统至关重要,使工程师能够重放动态场景、验证模型行为并生成合成训练数据。然而,这种高保真度的计算需求一直是个瓶颈——直到现在。
来自 Nsight 开发工具的关键见解
NVIDIA 的优化过程始于使用 Nsight Systems 进行性能分析,这是一款可视化 CPU、GPU 和其他资源工作负载行为的工具。初步分析发现 GPU 利用率上的效率低下,尤其是在 interpolate 函数中,由于大量小型 CUDA 内核导致性能受限。通过将这些操作融合为单个内核,NVIDIA 将处理时间从 4.184 毫秒减少到了仅 83.81 微秒,实现了 50 倍的改进。
进一步的优化解决了同步延迟和工作负载不平衡问题,使 GPU 能够更紧凑地处理任务。随后,NVIDIA 使用 Nsight Compute(另一款分析工具)分析了特定内核的性能,如处理激光雷达和摄像头数据的 renderBackward 内核。NVIDIA 将内核拆分为针对每种数据类型的单独版本,优化了资源分配,将 GPU 占用率从 15% 提升到最高 50%。最耗时的内核运行时间从 31 毫秒降至 18 毫秒。
对 AI 和机器人的影响
这些优化具有深远的影响。NuRec 是 NVIDIA Omniverse 平台的核心技术,服务于从自动驾驶汽车到数字孪生等多个行业。更快的重建时间直接提高了工程生产力,实现了实时场景处理。这对于依赖快速迭代完善感知模型和规划算法的自动驾驶和机器人开发者至关重要。
除了重建之外,NuRec 的性能提升还扩展到生成强化学习合成数据和进行大规模仿真等高需求任务。减少这些工作流的 GPU 时间不仅降低了基础设施成本,还加速了物理 AI 系统的广泛发展。NVIDIA 的 Omniverse 路线图,包括其雄心勃勃的 Cosmos 世界模型和 DSX 数据中心,将 NuRec 定位为下一代 AI 系统的关键技术。
战略背景
NVIDIA 在 NuRec 上的进步正值其在 AI 和仿真领域占据主导地位的更广泛努力之际。今年早些时候,NVIDIA 与 Microsoft 合作,利用 Omniverse 进行核基础设施项目,展示了该平台在传统机器人和自动驾驶应用之外的潜力。结合 Omniverse DSX AI 数据中心蓝图等创新,NuRec 巩固了 NVIDIA 在将真实世界数据转化为可操作仿真环境方面的领先地位。
虽然 NuRec 本身不是一种可交易资产,但其在 NVIDIA 生态系统中的作用使其成为推动公司增长的战略驱动力。随着 AI 采用加速,像 NuRec 和 Nsight 开发工具这样的技术将对投资于仿真技术的行业至关重要。
开发者和工程师可以直接通过 NVIDIA 的官网探索这些工具,Nsight Systems 和 Nsight Compute 可免费下载安装。NuRec 的持续优化凸显了性能调优的迭代性质以及 NVIDIA 在推动 GPU 加速仿真极限方面的承诺。
Image source: Shutterstock