NVIDIA 的 Cosmos Reason AI 模型推进物理推理能力
realtime news Aug 28, 2025 05:09
NVIDIA 的 Cosmos Reason AI 模型通过在 AI 训练中使用类似人类的常识在物理推理方面超越其他模型。了解 NVIDIA 如何引领 AI 的发展。

根据NVIDIA,NVIDIA 在通过开发模拟人类推理的 AI 模型来推动人工智能的前沿发展。该公司的 Cosmos Reason 模型最近在 Hugging Face 的物理推理排行榜上获得了第一名,标志着 AI 能力的重大里程碑。
弥合差距:AI 和人类常识
与人类不同,AI 模型缺乏与生俱来的常识——从现实世界经验中获得的理解。这包括鸟类不能倒飞或冰会融化成水的知识。为了解决这个问题,NVIDIA 正在开发测试来教给 AI 模型关于物理世界的限制,实际上赋予它们常识。
Cosmos Reason 模型是一个开放推理视觉语言模型(VLM),旨在增强物理 AI 应用,如机器人技术和自动驾驶汽车。值得注意的是,它可以使用其获得的物理常识在新场景中进行推理。
用类人推理训练 AI
NVIDIA 使用强化学习来赋予其 AI 模型关于物理世界的常识。例如,机器人被训练理解时空限制,这对车辆撞击测试等应用中的安全至关重要。NVIDIA 的研究科学家尹萃(Yin Cui)指出,如果没有这种训练,机器人可能会带来风险。
NVIDIA 数据工厂团队在此过程中发挥着关键作用,通过策划用于训练这些模型的大量数据集。来自不同背景的分析师为开发用于推理的生成式 AI 模型的数据单元做出了贡献。
数据策划与模型开发
数据策划过程始于基于现实世界视频数据创建问答对。这些问题类似于学校考试,旨在测试模型的推理能力。数据在用于训练诸如 Cosmos Reason 之类的模型之前,会经过严格的质量检查。
这一细致的过程确保 AI 模型能够安全有效地理解和与其环境互动。
应用和未来前景
具备推理能力的 AI 模型可以分析和预测结果,展示出类似人类的思维过程。例如,它们可以推测给定情境下最可能发生的情况,比如预判两辆车在同一车道上相向行驶的结果。
正如 NVIDIA 的首席研究科学家林宗益(Tsung-Yi Lin)所强调的,数据工厂团队提供高质量数据的能力对于开发智能自主代理和物理 AI 系统至关重要。这些系统预计能够安全地与现实世界互动,展示 NVIDIA 在 AI 技术领域的持续创新。
Image source: Shutterstock