最新更新
5/7/2026 12:00:00 AM

OpenAI:推出 API 新实时语音模型

OpenAI:推出 API 新实时语音模型

OpenAI 在 API 中发布实时语音模型,支持推理、翻译和转录,延续 GPT-4o 实时音频能力。

原文链接

详细分析

OpenAI 已通过 API 发布新的实时语音模型,可对语音进行推理、语言翻译和音频转录。

此次更新扩展了 GPT-4o 实时音频能力,过去一年公司持续优化低延迟语音交互。开发者现在无需独立语音转文本和文本转语音流程,即可构建处理复杂口语任务的代理。

这些模型面向企业客户支持、多语言会议和语音优先应用场景,缩小了 OpenAI voice model API 中文本与语音智能之间的差距。


OpenAI

@OpenAI

Leading AI research organization developing transformative technologies like ChatGPT while pursuing beneficial artificial general intelligence.