NVIDIA推出新AI工具以促进物理AI研究
realtime news Jun 03, 2026 15:52
NVIDIA通过Cosmos 3驱动的代理技能加速自动驾驶、机器人技术和视觉AI的开发。
NVIDIA推出了一套由Cosmos 3驱动的先进AI工具,旨在变革自动驾驶、机器人技术和视觉AI系统的开发。在CVPR 2026大会上宣布的这些“代理技能”将显著提升数据生成、仿真和策略训练等任务的效率,从而加速物理AI研究的进展。
Cosmos 3于5月31日刚刚发布,是世界上首个完全开放的“全能模型”,将视觉、推理和动作生成整合到一个框架中。它使研究人员能够为物理AI开发创建可扩展的端到端工作流程。NVIDIA的工具在GitHub上公开提供,并在运行最先进H100 Tensor Core GPU的NVIDIA Brev上托管了预配置环境。
为什么这很重要
物理AI研究面临的最大挑战之一是当前工作流程的碎片化,这减缓了实验的速度。NVIDIA的代理技能通过自动化关键步骤(例如场景重建、仿真和合成数据生成)来解决这一问题。例如,Neural Reconstruction工具可以将车队捕获的数据转换为可编辑的3D场景,使研究人员能够模拟边缘情况驾驶场景——这对自动驾驶车辆的开发至关重要。
这些进步对于解决自动驾驶培训中的“长尾”问题尤其有价值,该问题涉及在现实世界数据中很难捕获的罕见交互或异常条件。像NVIDIA AlpaGym和OmniDreams这样的工具通过实现高保真仿真和实时策略评估进一步提升了这一过程。
车辆之外的应用
尽管自动驾驶吸引了大量关注,但NVIDIA的新工具也扩展了在机器人技术和视觉AI领域的应用。在机器人领域,Isaac Sim和Isaac Lab框架允许研究人员自动化环境设置、仿真和策略训练等任务。例如,在医疗领域,Cosmos-H外科模拟器生成真实数据以训练自主外科机器人。
视觉AI研究人员可以利用Metropolis工具生成受控的视觉场景,从而帮助异常检测和缺陷识别。这对于制造业等需要高精度识别罕见缺陷的行业至关重要。
Cosmos 3:核心支柱
这些创新的核心是Cosmos 3,这是NVIDIA最新的AI模型。在20万亿模态数据标记上训练,该模型通过其混合变换器架构支持广泛的应用。该模型在预测性世界建模方面表现出色,这是现实环境中的关键能力。像Cosmos 3 Super这样的变体针对大规模合成数据生成进行了优化,而较轻的版本则优先考虑速度。
NVIDIA还成立了Cosmos联盟,与全球研究实验室合作以加速开放世界AI的发展。斯坦福大学、加州大学伯克利分校和清华大学等机构的早期采用,突显了它在学术和研究界的重要性。
市场背景
受其在AI硬件和软件领域的主导地位推动,NVIDIA的股票(NVDA)今年持续上涨。截至2026年6月3日,该股交易价格为216.43美元,市值达到5.28万亿美元。尽管过去24小时内价格下跌了2.87%,但该公司在AI领域的持续创新使其仍然是投资者的最爱。Cosmos 3以及向物理AI的更广泛推进可能会成为未来增长的催化剂,随着行业越来越多地采用这些技术,其潜力将进一步显现。
展望未来
NVIDIA的新工具代表了研究人员在物理AI方面的新范式。通过简化传统上分散的工作流程并为最先进的技术提供开放访问,该公司正将自己定位为AI开发下一个阶段的领导者。随着研究人员和机构的广泛采用,这些工具的影响可能会扩展到多个行业,从自动驾驶到机器人技术及其他领域。
Image source: Shutterstock