ElevenLabs发布Eleven v3:AI文本转语音模型支持70多种语言与情感音频标签
据ElevenLabs官方推特(@elevenlabsio)消息,ElevenLabs正式推出了Eleven v3的公开测试版,这是迄今为止最具表现力的AI文本转语音模型。Eleven v3支持70多种语言、多角色对话,并创新性地引入了如[兴奋]、[叹息]、[笑声]、[低语]等音频情感标签,极大提升了语音合成的真实感和应用场景。该模型有望推动全球内容本地化、智能语音配音和无障碍解决方案的商业化应用。当前公开测试阶段,6月期间价格优惠80%,为企业大规模集成先进TTS技术提供新机遇(来源:@elevenlabsio,2025年6月5日)。
原文链接详细分析
ElevenLabs于2025年6月5日通过其官方推特账号宣布推出Eleven v3(alpha),这是人工智能领域文本转语音(TTS)技术的一项重大进步。据称,这是迄今为止最具表现力的TTS模型,支持超过70种语言,为全球应用提供了高度多样性。此外,该模型引入了多发言人对话功能以及情感音频标签(如兴奋、叹息、笑声和耳语),使合成语音的情感表达更加细腻。目前,该alpha版本在2025年6月提供80%的折扣,降低了企业和开发者的试用门槛。TTS市场近年来增长迅速,尤其是在娱乐、教育、客户服务和内容创作等领域,对逼真语音合成技术的需求不断增加。Eleven v3通过提供情感智能和多语言音频解决方案,有望成为行业标杆。从商业角度看,这款技术为电子学习、娱乐和客户服务行业带来了显著机会,例如通过多语言支持定制教育内容或通过多发言人功能降低有声书制作成本。然而,企业在集成时需考虑技术成本和数据隐私问题,同时面对Google Cloud和Amazon Polly等竞争对手的挑战。未来,Eleven v3可能在虚拟现实和游戏领域有更广泛应用,但需解决伦理和监管问题,如防止语音合成的滥用。2025年alpha阶段的反馈将对最终版本的市场定位产生重要影响。
ElevenLabs
@elevenlabsioOur mission is to make content universally accessible in any language and voice.