NVIDIA发布先进机器人训练模型以增强AI开发
realtime news Aug 08, 2025 14:54
NVIDIA推出Cosmos WFMs,一套旨在革新物理AI训练的生成模型,应用于机器人和自动驾驶汽车。

根据NVIDIA Research,NVIDIA推出了一系列突破性的模型,称为世界基础模型(WFMs),以推进物理AI系统的训练。这些模型旨在应对对丰富标签数据集日益增长的需求,而这些数据集在实际场景中越来越难以人工捕捉。
介绍Cosmos WFMs
Cosmos平台是此项计划的核心,包括三种类型的模型:Cosmos Predict、Cosmos Transfer和Cosmos Reason。每种模型都专为机器人和自动驾驶汽车的特定应用定制。例如,Cosmos Predict可从文本、图像或视频生成未来世界状态,从而加速复杂任务中AI模型的合成数据生成。
Cosmos Predict:增强未来模拟
Cosmos Predict在创建连贯且物理准确的模拟方面至关重要。它在自动驾驶汽车开发中尤其有用,可从单个视频输入生成同步的多视角摄像机画面。这一功能对开发先进的自动驾驶技术至关重要。
该模型的应用扩展到像Cosmos-Drive-Dreams这样的项目,该项目在不同条件下生成高保真、多视角驾驶数据,有助于开发强大的自动驾驶系统。
Cosmos Transfer:多功能数据生成
Cosmos Transfer模型旨在从各种输入(如激光雷达扫描、深度图和用户提示)生成多样的世界模拟。此功能能够生成视觉多样的数据集,通过模拟各种环境条件增强机器人和自动系统的训练。
这些模型可以模拟不同的驾驶场景,为训练自动驾驶车辆提供了宝贵的数据,帮助其应对从天气变化到不同地形的多种条件。
Cosmos Reason:先进的AI推理
Cosmos Reason专注于长远推理的物理AI,使系统能够通过复杂的推理过程理解并做出决策。该模型对于策划高质量的训练数据至关重要,因为它可以通过理解现实世界的限制和行动序列来评估和增强合成数据的生成。
使用特定的数据集进行训练可以显著提升模型的性能,使其成为开发能够进行复杂决策AI系统的重要工具。
影响和未来前景
这些在WFMs上的进步有望改变机器人工学和自动驾驶汽车的AI训练格局。通过促进高精细和多样化的合成数据集的创建,NVIDIA的模型有望加速更先进、功能更强大的AI系统的发展。
NVIDIA在这一领域的持续研究和开发彰显了该公司推动AI技术界限的承诺,为开发者提供创建更智能和更具适应性系统的工具。
Image source: Shutterstock