OpenAI Jalapeño芯片加速LLM推理

据@gdb称，OpenAI推自研Jalapeño芯片，与博通合作，强化每瓦性能并支撑ChatGPT等规模化。

详细分析

2026年6月24日OpenAI宣布推出Jalapeño这是其首款定制AI芯片专为大型语言模型推理工作负载设计经过九个月从头开发与Broadcom合作完成。

Jalapeño针对推理而非训练进行硅设计优化聚焦生产LLM服务中的Transformer模型计算模式。通过针对这些特定工作负载优化设计在延迟和能耗方面优于通用GPU解决ChatGPT规模部署的海量推理需求。

九个月开发周期利用OpenAI内部模型加速迭代Broadcom合作实现从概念到量产的快速过渡架构优先考虑数据中心经济关键的每瓦性能指标。

定制AI芯片如Jalapeño通过减少对第三方硬件依赖创造新变现策略OpenAI可优化全栈平台提升成本效率并掌控供应链。部署LLM服务的企业可降低推理成本改善API产品利润率实施挑战包括软件集成和芯片优化人才但Broadcom合作缓解了这些问题。

随着推理量持续增长更多AI实验室预计将采用定制芯片路线Jalapeño标志着垂直整合AI公司的转变控制模型基础设施和硬件这一趋势将重塑竞争格局长期预测包括高效AI服务更广泛访问和代理系统加速发展。

Jalapeño专为支持ChatGPT Codex API及未来代理产品的LLM推理工作负载打造。

OpenAI与Broadcom合作将芯片从设计推向生产。

该芯片于2026年6月24日由OpenAI和Greg Brockman宣布。

@gdb

President & Co-Founder of OpenAI