predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info
NVIDIA Alpamayo 通过闭环技术增强自动驾驶模型训练 - Blockchain.News

NVIDIA Alpamayo 通过闭环技术增强自动驾驶模型训练

realtime news Jun 01, 2026 06:19

NVIDIA 的 Alpamayo 引入了用于自动驾驶汽车的闭环后训练技术,提升了推理能力和部署准备。

NVIDIA Alpamayo 通过闭环技术增强自动驾驶模型训练

NVIDIA 在其 Alpamayo 平台上推出了一种新的闭环训练框架,用于自动驾驶汽车(AV)模型。AlpaGym 系统将模拟输出直接连接到训练循环中,使自动驾驶政策能够在模拟环境中从其行为后果中学习。这标志着从开放式训练(通过输出与真实值比较)到闭环部署(每个决策都会影响车辆周围环境)的重要进步。

Alpamayo 平台于 2026 年 CES 发布,是 NVIDIA 为加速自动驾驶发展而设计的一套视觉-语言-动作(VLA)模型、仿真工具和开放数据集。其旗舰模型 Alpamayo 1 拥有 100 亿参数,结合了感知、因果推理和轨迹规划功能。尽管它主要作为“教师模型”使用,开发者可以通过后训练工作流(如 AlpaGym)微调更小的、专用车队模型。

为什么闭环训练很重要

在实际驾驶中,小错误——如刹车或转向的轻微误判——可能会积累,导致失败。通过 AlpaGym 实现的闭环训练直接解决了这一问题,使自动驾驶模型能够从模拟中决策的动态反馈中学习。这种方法揭示了静态数据集或开放式评估所无法暴露的故障模式。

NVIDIA 已将其 AlpaSim 仿真引擎与 Cosmos-RL 框架集成,以协调分布式强化学习(RL)的规模化运行。据 NVIDIA 称,该系统将 Alpamayo-R1 模型的推理质量提高了 45%,推理-动作一致性提高了 37%,实时延迟仅为 99 毫秒。AlpaSim 能够生成从城市交通到极端天气的多样化场景,为训练过程增加了深度。

AlpaGym 的工作原理

开发者可以从现有 Alpamayo 检查点开始,通过 AlpaGym 通过四个关键步骤优化自动驾驶模型:

  • 安装并配置具有 CUDA 和 Redis 依赖项的 AlpaGym。
  • 定义一个闭环奖励结构,在进度指标与碰撞或偏离车道等失败惩罚之间取得平衡。
  • 启动闭环训练,基于模拟反馈迭代改进策略。
  • 导出后训练的检查点以用于部署或在 AlpaSim 中进一步评估。

此管道可从单个 GPU 扩展到多节点集群,使其对探索 L4 级自动驾驶的初创公司和成熟汽车制造商都具有吸引力。

市场影响

截至 2026 年 5 月,NVIDIA 的更广泛自动驾驶生态系统正在获得关注。其 DRIVE Hyperion 平台——Alpamayo 是其中的重要组成部分——已被如比亚迪、吉利和日产等主要汽车制造商采用。梅赛德斯最近推出了运行 NVIDIA 全栈自动驾驶软件的新 CLA 轿车,表明行业对 NVIDIA 技术的依赖日益增长。

随着自动驾驶市场预计到 2030 年将超过 2000 亿美元,NVIDIA 提供开放、可定制 AI 平台的战略可能巩固其领导地位。通过使汽车制造商能够基于专有数据进行模型后训练,而无需构建核心基础设施,NVIDIA 降低了自动驾驶开发的门槛。

下一步是什么?

对 Alpamayo 感兴趣的开发者可以在 GitHub 上访问后训练方法,包括为特定场景调整模型的工具。NVIDIA 还在 CVPR 2026 推出了公共自动驾驶挑战,以基准测试性能,促进该领域的合作与创新。

对于投资者来说,NVIDIA 在 AI 驱动的自动驾驶技术领域的主导地位凸显了其增长潜力。随着其股票已经因 5.15 万亿美元的市值和截至 2026 年 5 月 30 日的 211.14 美元股价而大涨,像 Alpamayo 这样的持续进步可能进一步巩固其作为自动驾驶系统领导者的地位。

Image source: Shutterstock