语音模型 AI快讯列表 | Blockchain.News

predict.info — Premium Domain For Sale Domain only: USD 200,000. Prediction platform technology priced separately. predict.info

Inquire

AI 快讯列表

AI 快讯列表关于语音模型

时间	详情
2026-07-09 15:01	GPT Live API招募设计合作伙伴据gdb称，OpenAI邀测GPT Live语音API，将在ChatGPT上线。原文链接
2026-07-09 04:03	GPT Live发布：OpenAI语音突破据OpenAI称，GPT Live在ChatGPT上线，支持自然语音互动，萨姆阿尔特曼发布视频证实。原文链接
2026-07-09 00:50	GPT Live全面扩展语音接入据OpenAI称，GPT Live覆盖Go、Plus、Pro，并向免费用户推进。原文链接
2026-03-06 22:53	Google Research发布WAXAL语音数据集：覆盖27种非洲语言的2400+小时语音——2026最新深度分析与商机据GoogleResearch在X平台发布的信息，WAXAL公开语音数据集提供超过2400小时高质量语音，覆盖27种撒哈拉以南非洲语言，服务于26个以上国家、逾一亿名使用者，直接缓解非洲语音AI的核心痛点——数据稀缺。根据Jeff Dean在X的报道，此项目由非洲本土机构主导并深度参与，有助于降低偏差、提升ASR与TTS训练效果，并为语音基础模型提供更全面的训练语料。依据Google Research的说明，WAXAL的开放获取将加速呼叫中心、语音助手、医疗分诊与金融服务本地化等应用落地，降低数据采集成本，提升多语言部署速度；同时为创业公司与大型企业提供可扩展的语料基础，以进行领域微调并满足本地语言合规需求。原文链接
2026-01-27 17:35	最新分析：ElevenLabs Malyx语音模型革新游戏叙事体验据ElevenLabs在X平台发布，Engaging Characters for Video Games中的Malyx语音模型可为视频游戏带来深沉且威严的恶魔声音，极大提升沉浸式叙事和游戏体验。ElevenLabs表示，这一AI语音技术使开发者能够轻松集成高质量、具备独特角色风格的配音，从而增强玩家参与度和游戏叙事深度。随着AI语音应用的进步，游戏工作室有望借此提升角色真实感并在激烈市场中实现差异化，创造更多商业机会。原文链接
2025-10-20 17:12	阿里巴巴发布Qwen3-Max等系列AI模型，推动大规模多模态人工智能发展据DeepLearning.AI报道，阿里巴巴全面升级了Qwen3系列AI模型，包括Qwen3-Max（1万亿参数MoE封闭权重模型，支持26.2万Token输入，API定价每百万Token 约1.2至6美元）、Qwen3-VL-235B-A22B（开放权重视觉-语言大模型，支持文本/图像/视频输入，支持最高100万Token上下文，在多项视觉、视频和智能体基准测试中取得领先）、以及Qwen3-Omni-30B-A3B（开放权重多模态语音模型，在36项音频/视听测试中22项达到业界领先）。这些新模型展示了阿里巴巴在超大规模、强性能AI领域的创新，为企业级自然语言处理、计算机视觉和语音场景提供多样化的落地应用与商业机会。（来源：DeepLearning.AI, https://www.deeplearning.ai/the-batch/alibaba-expands-qwen3-family-with-1-trillion-parameter-max-open-weights-qwen3-vl-and-qwen3-omni-voice-model/）原文链接
2025-06-07 19:12	音频标签提升AI语音交互：实际应用与商业机会深度分析据OpenAI官方开发者文档（2024年5月）介绍，音频标签如[sarcastic]、[whispers]、[excited]和[strong French accent]，能够精准控制生成式AI语音的表达方式，提升用户交互体验。企业可利用这些标签打造个性化客户服务、智能语音助手及品牌音频差异化，从而增强用户黏性和市场竞争力。但需注意，不同AI语音模型对标签的支持程度不同，无法实现所有风格的完美切换，因此推动了更高兼容性语音模型的开发和创新。这为AI厂商与企业打开了新的业务增长空间。原文链接