NVIDIA Nemotron 3 Nano Omni 在 Together AI 上推出用于多模态人工智能 - Blockchain.News

NVIDIA Nemotron 3 Nano Omni 在 Together AI 上推出用于多模态人工智能

realtime news Apr 28, 2026 17:07

Together AI 集成了 NVIDIA 的 Nemotron 3 Nano Omni,这是一款多模态人工智能模型,为开发者在视频、音频和文本上的推理提供了可扩展、高效的解决方案。

NVIDIA Nemotron 3 Nano Omni 在 Together AI 上推出用于多模态人工智能

Together AI 宣布 NVIDIA 的 Nemotron 3 Nano Omni 模型现已在其平台上推出,这标志着多模态人工智能领域的一个重要进步。Nemotron 3 Nano Omni 旨在通过单次推理统一视频、音频、图像和文本的推理,为开发者提供了一个强大的工具,用于构建复杂的、具备自主能力的大规模应用程序。

Nemotron 3 Nano Omni 代表了 NVIDIA 在混合模型架构领域的最新尝试。这款拥有 300 亿参数的专家混合(MoE)设计在处理过程中每个 token 仅激活 30 亿参数,并利用多 token 预测实现高效计算。根据 Together AI 的说法,这种架构在保持低延迟的同时解锁了更快、更具成本效益的多模态推理能力,这对于现实世界中的 AI 部署至关重要。

为什么选择 Together AI?

利用 Together AI 的基础设施,开发者可以访问一个全面管理的环境,该环境针对生产规模的工作负载进行了优化。平台与 Nemotron 3 Nano Omni 的紧密集成消除了管理 GPU 的操作复杂性,使团队能够更高效地开发和部署 AI 应用程序。Together AI 还为开发者提供了安全的 API,确保在不牺牲性能的情况下保护数据。

Nemotron 3 Nano Omni 的一个突出功能是能够处理多达 256,000 个 token 的共享上下文,涵盖多种输入格式。这消除了多模态 AI 系统中常见的分段式管道的需求,在这些系统中,通常需要分别处理视觉、音频和文本输入。通过整合这些任务,该模型减少了延迟,防止错误累积,并简化了系统架构。

主要优势

  • 精简的多模态处理:在一个模型中处理视频、音频和文档推理,减少了对多个管道的需求。
  • 可扩展性:高度高效,支持 NVIDIA Hopper 和 Blackwell 架构,提供从云到本地系统的灵活部署选项。
  • 开放框架:为开发者提供了开放的权重、数据和配方,确保没有锁定并完全控制数据。

重点应用

Nemotron 3 Nano Omni 的统一推理能力解锁了广泛的应用场景:

  • 客户服务:AI 代理可以同时解释通话录音、屏幕截图和政策文档,从而提高响应的准确性和效率。
  • 金融分析:分析师可以将来自财报电话录音、演示幻灯片和监管文件的洞察整合为可操作的情报。
  • 自动化:计算机使用代理能够处理屏幕录制并根据预定义约束验证操作,从而优化工作流程。

接下来是什么?

NVIDIA Nemotron 3 Nano Omni 现已在 Together AI 上推出,将该平台定位为可扩展、多模态 AI 解决方案的领导者。对于希望构建复杂自主应用程序的开发者来说,此次合作提供了性能、灵活性和易部署性的完美结合。

有关模型的更多信息和访问方式,请访问 Together AI 的官方网站。

Image source: Shutterstock