Place your ads here email us at info@blockchain.news
OpenAI的GPT-OSS模型现已为NVIDIA RTX GPU优化 - Blockchain.News

OpenAI的GPT-OSS模型现已为NVIDIA RTX GPU优化

realtime news Aug 05, 2025 19:19

OpenAI与NVIDIA合作,已将其开源的GPT-OSS模型优化用于NVIDIA RTX GPU,提升了本地AI模型的性能和开发者的可及性。

OpenAI的GPT-OSS模型现已为NVIDIA RTX GPU优化

根据NVIDIA的博客,OpenAI已与NVIDIA合作,将其新的开源GPT-OSS模型优化用于NVIDIA的GeForce RTX和RTX PRO GPU,大幅提升了AI开发者和爱好者的性能和可及性。这些模型,gpt-oss-20b和gpt-oss-120b,是为本地使用和测试而设计的,使得在个人计算机和工作站上进行高级AI应用成为可能。

加强NVIDIA RTX的性能

优化后的模型使用NVIDIA的RTX AI PC和工作站,在GeForce RTX 5090 GPU上提供高达每秒256个令牌的性能。此合作使得从云计算到个人电脑的高效快速推理成为可能,应用范围包括网络搜索和使用推理模型的深入研究。

NVIDIA CEO 黄仁勋强调了这些模型的潜力,他表示:“gpt-oss模型让全世界的开发者可以在这种最先进的开源基础上进行开发,增强美国在AI技术方面的领导力。”此次发布强调了NVIDIA在AI领域,从训练到推理,各个平台的主导地位。

开源的灵活性和创新

gpt-oss模型是灵活的、开放权重的推理模型,具有连锁思维能力和可调节的推理努力级别。它们在NVIDIA H100 GPU上进行训练,支持复杂任务,如编程帮助和文件理解。支持的上下文长度高达131,072,使其成为本地推理中可用的最长模型之一,非常适合广泛的研究任务。

这些模型是NVIDIA RTX上可用的首批MXFP4模型,提供高模型质量和高效的资源使用。NVIDIA与开源社区的持续合作,包括诸如llama.cpp和GGML张量库等项目,确保了在RTX GPU上优化的性能。

开发者可访问的工具

为了易于使用,开发者可以利用Ollama应用,该应用已针对至少拥有24GB VRAM的RTX GPUs进行了优化。此应用提供与模型交互的无缝界面,无需额外配置即可获得最佳性能。诸如聊天中的PDF支持和多模态支持等附加功能优化用户体验。

开发者通过Microsoft AI Foundry Local获得进一步的选择,这是一个目前在公开预览中用于设备上AI推理的解决方案。此工具与现有工作流程顺畅集成,并支持在Windows平台上的高效能AI模型部署。

这些模型的发布标志着AI技术的重大进步,为开发者提供了强大的工具来创新并增强AI加速应用。NVIDIA通过协作项目和技术领导力继续支持AI社区。

Image source: Shutterstock