NVIDIA发布Cosmos 3以推动物理AI发展
realtime news Jun 01, 2026 06:11
NVIDIA推出了Cosmos 3,这是一种尖端的物理AI模型,可加速机器人和自主系统的开发。
NVIDIA正式发布了Cosmos 3,这是其最新的开放世界基础模型,旨在加速物理AI的进步。Cosmos 3基于一种新的混合变换器架构,将视觉推理、合成世界生成和动作预测整合为一个统一系统。此公告于2026年6月1日在NVIDIA GTC台北大会上发布,标志着AI驱动的机器人和自动驾驶汽车(AV)开发的重大飞跃。
Cosmos 3的重要性
Cosmos 3是首个完全开放的“全模型”,能够在文本、图像、视频、环境声音和动作之间实现多模态生成。通过显著减少训练周期,它使开发人员可以用更少的数据和更低的成本泛化物理AI解决方案。这一功能对于创建能够在现实环境中感知、推理和行动而无需大量重新训练的机器人和AV至关重要。
据NVIDIA首席执行官黄仁勋表示:“物理AI的大爆炸即将到来。Cosmos 3为构建能够在物理世界中推理、规划和行动的系统提供了跨代飞跃。”
技术创新
该模型引入了一种新的混合变换器架构,将推理和生成变换器相结合。这一设置使Cosmos 3能够在生成预测视频和动作序列之前理解对象交互、空间关系和运动。通过数十亿多模态样本训练,该系统为物理AI策略开发和合成数据生成提供了强大的基础。
Cosmos 3已在包括Physics-IQ、PAI-Bench和RoboArena在内的关键物理AI评估中名列前茅,巩固了其在该领域的领导地位。
扩展生态系统:Cosmos联盟
除了模型发布外,NVIDIA还推出了Cosmos联盟,这是与Agile Robots、Black Forest Labs和Skild AI等AI实验室和机器人公司合作的倡议。该联盟旨在推动世界模型的开放开发,促进各行业的互操作性和创新。
Cosmos 3与NVIDIA现有的AI技术栈无缝集成,包括用于3D模拟的Omniverse、大规模训练的DGX Cloud,以及用于视频处理的NeMo Curator。这些集成使其成为NVIDIA更广泛的物理AI战略的核心,该战略涵盖了机器人、自主驾驶和工业自动化领域的应用。
市场影响
对于投资者和行业利益相关者来说,Cosmos 3凸显了NVIDIA在AI硬件和软件市场中的主导地位。该平台对物理AI的关注与机器人和AV解决方案不断增长的需求保持一致,这些领域预计将在未来十年内实现爆炸性增长。NVIDIA能够同时提供硬件(数据中心GPU)和基础模型,这使其成为这一新兴领域的关键参与者。
Cosmos 3的开放访问模式可通过Hugging Face和NVIDIA的NGC等平台获得,这也提高了其对开发者的吸引力,可能加速跨行业的采用。早期应用案例包括来自Boston Dynamics和理想汽车等合作伙伴的机器人应用,以及智能制造和仓库安全的工业AI解决方案。
可用性
Cosmos 3的Super和Nano型号现已发布,Edge版本即将推出,用于实时边缘推理。开发者可以通过Hugging Face、GitHub和NVIDIA的构建门户访问这些模型。NVIDIA还通过Microsoft Azure和CoreWeave等合作伙伴提供基于云的训练和部署选项。
通过Cosmos 3,NVIDIA继续推动AI创新的边界,为机器人和自主系统的变革性进步奠定了基础。随着物理AI生态系统的成熟,NVIDIA在模型开发和硬件基础设施方面的领导地位使其处于这一快速发展的领域的前沿。
Image source: Shutterstock