predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info
NVIDIA Cosmos 3 加速物理 AI 开发 - Blockchain.News

NVIDIA Cosmos 3 加速物理 AI 开发

realtime news Jun 01, 2026 05:32

NVIDIA 发布了 Cosmos 3,这是一款全新的世界基础模型,通过高级推理和动作生成,革新机器人、自主车辆和视觉 AI 的发展。

NVIDIA Cosmos 3 加速物理 AI 开发

NVIDIA 推出了 Cosmos 3,这是其最新的世界基础模型,旨在改变物理 AI 系统的开发。在 COMPUTEX 2026 的 GTC 台北大会上宣布的 Cosmos 3 集成了视觉推理、多模态生成和动作预测于一个平台。这项创新有望加速机器人、自主车辆和视觉 AI 的发展,使这些系统在现实环境中能够“先思考再行动”。

与之前的版本不同,Cosmos 3 是首个将合成世界生成与实时推理和动作模拟统一的模型。通过其 变换器组合 架构,该模型可以解读场景、预测结果并生成动作数据。例如,它使机器人可以为抓取、移动和放置物体等任务创建精确的轨迹。开发者还可以针对特定环境微调模型,以确保其适应独特的工业或操作需求。

弥合 AI 模型与现实世界动作之间的差距

物理 AI 系统通常在面对意外场景时难以应对,例如行人突然进入交通流或机器人遇到陌生的仓库布局。Cosmos 3 通过生成模拟现实条件的合成数据解决了这一挑战,使开发者能够训练系统处理在现实生活中难以捕捉的罕见或复杂场景。这些能力对物流、制造和自主驾驶等行业尤为重要。

该模型生成动作条件数据的能力使其成为机器人策略开发的变革性工具。像 Agile Robots 这样的公司已经在利用 Cosmos 3 为人形和工业机器人进行训练,而 NVIDIA 自己的 GEAR 团队使用它来增强机器人在模拟和现实部署中的推理和动作规划能力。

扩展在智慧城市和基础设施中的应用

除了机器人领域,Cosmos 3 正被整合到智慧城市和工业应用中。其视觉语言推理模块使 AI 系统能够解读复杂环境中的活动,从分析交通模式到检测工厂操作中的异常。例如,Linker Vision 使用 Cosmos 3 分析实时视频流并提供城市规划的可操作见解,从而优化城市基础设施。

值得注意的是,Cosmos 3 在 VANTAGE-Bench 等基准测试中排名第一,是场景理解和智能基础设施预测领域的领导者。

NVIDIA 和物理 AI 的战略意义

Cosmos 3 代表了 NVIDIA 在物理 AI 领域迈出的重要一步,这一领域被高管们在 GTC 2026 上强调为一个重要的计算平台转型。通过将其能力与 NVIDIA 的 Omniverse 和 Isaac 机器人平台相结合,Cosmos 3 提供了一个用于开发、测试和部署物理 AI 解决方案的强大生态系统。

自 2025 年首次发布以来,Cosmos 平台一直是 NVIDIA 主导物理 AI 领域战略的基石。凭借 Cosmos 3,公司加倍致力于推动通用模型在各行业的突破。早期用户包括机器人公司和汽车 AI 开发者,这表明它在依赖复杂现实交互的行业中具有重塑行业的潜力。

如何获取 Cosmos 3

开发者可以通过 NVIDIA 的 Build 平台 开始尝试 Cosmos 3,从 Hugging Face 下载开放模型,或通过 GitHub 定制工作流。该模型根据 OpenMDW 1.1 许可证提供,简化了训练、修改和部署流程。

随着 NVIDIA 不断扩展其开放模型家族,Cosmos 3 将公司置于物理 AI 创新的最前沿,其应用范围涵盖机器人、智慧城市和自主车辆。对于开发者和行业利益相关者来说,它是一个应对现实世界挑战的重要工具——且具有规模化能力。

Image source: Shutterstock