OpenAI的GPT-OSS模型现已为NVIDIA RTX GPU优化

OpenAI的GPT-OSS模型现已为NVIDIA RTX GPU优化 - Blockchain.News

根据NVIDIA的博客，OpenAI已与NVIDIA合作，将其新的开源GPT-OSS模型优化用于NVIDIA的GeForce RTX和RTX PRO GPU，大幅提升了AI开发者和爱好者的性能和可及性。这些模型，gpt-oss-20b和gpt-oss-120b，是为本地使用和测试而设计的，使得在个人计算机和工作站上进行高级AI应用成为可能。

加强NVIDIA RTX的性能

优化后的模型使用NVIDIA的RTX AI PC和工作站，在GeForce RTX 5090 GPU上提供高达每秒256个令牌的性能。此合作使得从云计算到个人电脑的高效快速推理成为可能，应用范围包括网络搜索和使用推理模型的深入研究。

NVIDIA CEO 黄仁勋强调了这些模型的潜力，他表示：“gpt-oss模型让全世界的开发者可以在这种最先进的开源基础上进行开发，增强美国在AI技术方面的领导力。”此次发布强调了NVIDIA在AI领域，从训练到推理，各个平台的主导地位。

开源的灵活性和创新

gpt-oss模型是灵活的、开放权重的推理模型，具有连锁思维能力和可调节的推理努力级别。它们在NVIDIA H100 GPU上进行训练，支持复杂任务，如编程帮助和文件理解。支持的上下文长度高达131,072，使其成为本地推理中可用的最长模型之一，非常适合广泛的研究任务。

这些模型是NVIDIA RTX上可用的首批MXFP4模型，提供高模型质量和高效的资源使用。NVIDIA与开源社区的持续合作，包括诸如llama.cpp和GGML张量库等项目，确保了在RTX GPU上优化的性能。

开发者可访问的工具

为了易于使用，开发者可以利用Ollama应用，该应用已针对至少拥有24GB VRAM的RTX GPUs进行了优化。此应用提供与模型交互的无缝界面，无需额外配置即可获得最佳性能。诸如聊天中的PDF支持和多模态支持等附加功能优化用户体验。

开发者通过Microsoft AI Foundry Local获得进一步的选择，这是一个目前在公开预览中用于设备上AI推理的解决方案。此工具与现有工作流程顺畅集成，并支持在Windows平台上的高效能AI模型部署。

这些模型的发布标志着AI技术的重大进步，为开发者提供了强大的工具来创新并增强AI加速应用。NVIDIA通过协作项目和技术领导力继续支持AI社区。

Image source: Shutterstock

Bookmark

OpenAI的GPT-OSS模型现已为NVIDIA RTX GPU优化

加强NVIDIA RTX的性能

开源的灵活性和创新

开发者可访问的工具

Premium Sponsors

Flash News