NVIDIA Alpamayo 通过闭环技术增强自动驾驶模型训练

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

NVIDIA 在其 Alpamayo 平台上推出了一种新的闭环训练框架，用于自动驾驶汽车（AV）模型。AlpaGym 系统将模拟输出直接连接到训练循环中，使自动驾驶政策能够在模拟环境中从其行为后果中学习。这标志着从开放式训练（通过输出与真实值比较）到闭环部署（每个决策都会影响车辆周围环境）的重要进步。

Alpamayo 平台于 2026 年 CES 发布，是 NVIDIA 为加速自动驾驶发展而设计的一套视觉-语言-动作（VLA）模型、仿真工具和开放数据集。其旗舰模型 Alpamayo 1 拥有 100 亿参数，结合了感知、因果推理和轨迹规划功能。尽管它主要作为“教师模型”使用，开发者可以通过后训练工作流（如 AlpaGym）微调更小的、专用车队模型。

为什么闭环训练很重要

在实际驾驶中，小错误——如刹车或转向的轻微误判——可能会积累，导致失败。通过 AlpaGym 实现的闭环训练直接解决了这一问题，使自动驾驶模型能够从模拟中决策的动态反馈中学习。这种方法揭示了静态数据集或开放式评估所无法暴露的故障模式。

NVIDIA 已将其 AlpaSim 仿真引擎与 Cosmos-RL 框架集成，以协调分布式强化学习（RL）的规模化运行。据 NVIDIA 称，该系统将 Alpamayo-R1 模型的推理质量提高了 45%，推理-动作一致性提高了 37%，实时延迟仅为 99 毫秒。AlpaSim 能够生成从城市交通到极端天气的多样化场景，为训练过程增加了深度。

AlpaGym 的工作原理

开发者可以从现有 Alpamayo 检查点开始，通过 AlpaGym 通过四个关键步骤优化自动驾驶模型：

安装并配置具有 CUDA 和 Redis 依赖项的 AlpaGym。
定义一个闭环奖励结构，在进度指标与碰撞或偏离车道等失败惩罚之间取得平衡。
启动闭环训练，基于模拟反馈迭代改进策略。
导出后训练的检查点以用于部署或在 AlpaSim 中进一步评估。

此管道可从单个 GPU 扩展到多节点集群，使其对探索 L4 级自动驾驶的初创公司和成熟汽车制造商都具有吸引力。

市场影响

截至 2026 年 5 月，NVIDIA 的更广泛自动驾驶生态系统正在获得关注。其 DRIVE Hyperion 平台——Alpamayo 是其中的重要组成部分——已被如比亚迪、吉利和日产等主要汽车制造商采用。梅赛德斯最近推出了运行 NVIDIA 全栈自动驾驶软件的新 CLA 轿车，表明行业对 NVIDIA 技术的依赖日益增长。

随着自动驾驶市场预计到 2030 年将超过 2000 亿美元，NVIDIA 提供开放、可定制 AI 平台的战略可能巩固其领导地位。通过使汽车制造商能够基于专有数据进行模型后训练，而无需构建核心基础设施，NVIDIA 降低了自动驾驶开发的门槛。

下一步是什么？

对 Alpamayo 感兴趣的开发者可以在 GitHub 上访问后训练方法，包括为特定场景调整模型的工具。NVIDIA 还在 CVPR 2026 推出了公共自动驾驶挑战，以基准测试性能，促进该领域的合作与创新。

对于投资者来说，NVIDIA 在 AI 驱动的自动驾驶技术领域的主导地位凸显了其增长潜力。随着其股票已经因 5.15 万亿美元的市值和截至 2026 年 5 月 30 日的 211.14 美元股价而大涨，像 Alpamayo 这样的持续进步可能进一步巩固其作为自动驾驶系统领导者的地位。

Image source: Shutterstock

Bookmark

NVIDIA Alpamayo 通过闭环技术增强自动驾驶模型训练

为什么闭环训练很重要

AlpaGym 的工作原理

市场影响

下一步是什么？

Premium Sponsors

Flash News