NVIDIA 的 Cosmos Reason AI 模型推进物理推理能力

NVIDIA 的 Cosmos Reason AI 模型推进物理推理能力 - Blockchain.News

根据NVIDIA，NVIDIA 在通过开发模拟人类推理的 AI 模型来推动人工智能的前沿发展。该公司的 Cosmos Reason 模型最近在 Hugging Face 的物理推理排行榜上获得了第一名，标志着 AI 能力的重大里程碑。

弥合差距：AI 和人类常识

与人类不同，AI 模型缺乏与生俱来的常识——从现实世界经验中获得的理解。这包括鸟类不能倒飞或冰会融化成水的知识。为了解决这个问题，NVIDIA 正在开发测试来教给 AI 模型关于物理世界的限制，实际上赋予它们常识。

Cosmos Reason 模型是一个开放推理视觉语言模型（VLM），旨在增强物理 AI 应用，如机器人技术和自动驾驶汽车。值得注意的是，它可以使用其获得的物理常识在新场景中进行推理。

NVIDIA 使用强化学习来赋予其 AI 模型关于物理世界的常识。例如，机器人被训练理解时空限制，这对车辆撞击测试等应用中的安全至关重要。NVIDIA 的研究科学家尹萃（Yin Cui）指出，如果没有这种训练，机器人可能会带来风险。

NVIDIA 数据工厂团队在此过程中发挥着关键作用，通过策划用于训练这些模型的大量数据集。来自不同背景的分析师为开发用于推理的生成式 AI 模型的数据单元做出了贡献。

数据策划过程始于基于现实世界视频数据创建问答对。这些问题类似于学校考试，旨在测试模型的推理能力。数据在用于训练诸如 Cosmos Reason 之类的模型之前，会经过严格的质量检查。

这一细致的过程确保 AI 模型能够安全有效地理解和与其环境互动。

具备推理能力的 AI 模型可以分析和预测结果，展示出类似人类的思维过程。例如，它们可以推测给定情境下最可能发生的情况，比如预判两辆车在同一车道上相向行驶的结果。

正如 NVIDIA 的首席研究科学家林宗益（Tsung-Yi Lin）所强调的，数据工厂团队提供高质量数据的能力对于开发智能自主代理和物理 AI 系统至关重要。这些系统预计能够安全地与现实世界互动，展示 NVIDIA 在 AI 技术领域的持续创新。

Image source: Shutterstock