NVIDIA 发布用于抓取、驾驶和虚拟代理的 AI 模型
realtime news Jun 03, 2026 16:00
NVIDIA 在 CVPR 2026 上展示了其最新的 AI 突破,重点聚焦于机器人、自主驾驶和虚拟代理训练的扩展,重新定义了物理 AI 的开发。
NVIDIA Research 在人工智能领域开辟了新天地,并在 CVPR 2026 会议上展示了三项关键创新。这些突破涵盖机器人技术、自主驾驶和虚拟代理,进一步巩固了 NVIDIA 在物理 AI 市场的主导地位——截至 2026 年 6 月 3 日,该公司的市值已高达 5.28 万亿美元。
这些新技术的核心在于扩展 AI 训练以解决复杂的现实问题。从让机器人在无需重新训练的情况下适应新工具,到让自动驾驶车辆更快地思考,以及在大规模模拟环境中训练虚拟代理,NVIDIA 的进步旨在跨多种应用场景推广 AI 的能力。
GraspGen-X:适用于任何机器人的零样本抓取技术
GraspGen-X 是首个用于机器人抓取的基础模型,解决了机器人领域的一个主要瓶颈。传统上,为特定抓取设备训练的 AI 系统在部署到新硬件时需要重新训练。GraspGen-X 通过将其对几何和接触的理解应用于其遇到的任何机器人抓取工具,从而消除了这种低效。
该模型基于一个包含 20 亿次模拟抓取的数据集进行训练,这些抓取涉及各种对象形状和抓取器配置。这使机器人能够即开即用地适应新任务,大大减少了机器人公司开发的时间。GraspGen-X 可与 curoboV2(基于 CUDA 加速的运动规划库)无缝集成,实现真实世界的部署。
LCDrive:为自动驾驶车辆提供更快的思维
在自动驾驶领域,NVIDIA 推出了 LCDrive,这是一种针对车辆嵌入式硬件计算限制优化的模型。不像依赖于单词标记且需要大量处理时间的传统基于文本的推理模型,LCDrive 将其推理压缩为紧凑的潜在表示。这种方法将标记使用量减少了约 50%,同时保持了决策质量,从而实现了更快、更安全的自动驾驶车辆响应。
LCDrive 基于 NVIDIA 的 Alpamayo 平台,其中包括最近推出的 Alpamayo 2 Super——一个专为 L4 级机器人出租车应用设计的 320 亿参数模型。这些进展进一步巩固了 NVIDIA 在自动驾驶技术领域的领导地位,其 DRIVE Hyperion 平台已经成为机器人出租车车队的全球标准。
NitroGen:规模化训练虚拟代理
NitroGen 利用 NVIDIA 的 Isaac GR00T 架构,在虚拟环境中训练 AI 代理,将电子游戏用作结构化的训练场。通过在 1,000 多款游戏中交互并记录 40,000 小时的游戏数据,该模型使代理能够将其技能推广到新环境。这一创新使代理在低数据场景中的性能相比以前的方法提高了多达 52%。
NitroGen 的潜力超越了游戏领域。它可以为自适应 AI 伴侣、非玩家角色甚至现实世界中的机器人应用(如家庭助手)提供支持。该模型是开源的,可通过 GitHub 和 Hugging Face 获得,鼓励更广泛的采用和合作。
市场和行业影响
NVIDIA 的这些公告紧随其最近在 GTC Taipei 2026 活动上的发布。活动中,该公司推出了 Cosmos 3,这是一种用于物理 AI 的新基础模型,旨在预测和模拟现实世界环境。随着 AI 推动其市值达到 5.28 万亿美元,NVIDIA 正在巩固其作为机器人和自主系统行业支柱的地位。
对于投资者而言,这些发展突显了 NVIDIA 在机器人和自动驾驶等高增长垂直领域的持续扩张。公司通过在各种用例中扩展 AI 训练,同时提供开源工具以加速采用的战略,使其成为下一波 AI 驱动创新中的重要推动力量。
随着 NVIDIA 在 AI 基础设施领域的持续主导,这些 CVPR 2026 的突破进一步强化了其作为构建更智能、更具适应性自主系统首选平台的角色。
Image source: Shutterstock