Google DeepMind 发布语音重大升级:更自然人声、覆盖70余种语言并全面启用SynthID水印 | AI快讯详情 | Blockchain.News
最新更新
4/15/2026 4:05:00 PM

Google DeepMind 发布语音重大升级:更自然人声、覆盖70余种语言并全面启用SynthID水印

Google DeepMind 发布语音重大升级:更自然人声、覆盖70余种语言并全面启用SynthID水印

据 @GoogleDeepMind 表示,其最新语音技术实现更自然的人声合成,支持包含印地语、日语、德语在内的70余种语言,并为所有输出启用SynthID水印。根据 Google DeepMind 在Twitter的发布,这一升级有助于在全球客户服务、本地化配音与无障碍场景中快速落地,同时通过不可感知的水印实现内容可溯源,满足企业合规与品牌安全需求。

原文链接

详细分析

谷歌DeepMind最近在AI驱动的语音合成方面的进步标志着人工智能在全球范围内变得更易访问和更具伦理性的重大飞跃。根据他们在2026年4月15日的官方Twitter公告,此更新引入了更自然的语音发音、对包括印地语、日语和德语在内的70多种语言的支持,以及在所有输出上集成SynthID水印技术。这一发展基于DeepMind在生成AI方面的持续工作,提升了从客户服务到内容创建的工具。根据Google DeepMind的公告,更自然的语音旨在减少文本到语音系统中常见的机器人语气,使互动感觉更像人类。这一点尤为关键,因为AI采用率激增,全球文本到语音市场预计到2026年将达到50亿美元,正如MarketsandMarkets在2021年分析并于2023年更新的报告所述。多语言支持解决了AI可访问性的关键障碍,使非英语地区的业务能够利用语音AI而无语言限制。SynthID是DeepMind于2023年首次为图像引入的水印技术,现在扩展到音频,嵌入不可察觉的标记来检测AI生成的内容并打击虚假信息。这发生在对深度假冒的担忧上升之际,世界经济论坛2024年报告强调AI生成的音频是全球稳定的首要风险。从业务角度来看,这些增强开辟了巨大的市场机会。电子商务和电信公司可以实施更自然的语音助手,提高客户参与度和满意度。例如,将这项技术集成到呼叫中心可能将运营成本降低高达30%,基于德勤2023年关于AI在客户服务中的研究。多语言支持将DeepMind定位为竞争格局中的领导者,挑战像OpenAI的Whisper模型(截至2022年支持99种语言)和亚马逊的Polly(2024年更新了神经TTS改进)的对手。然而,实施挑战包括确保数据隐私符合欧盟AI法案等法规,该法案从2024年生效,要求高风险AI系统透明。企业必须通过采用道德最佳实践,如定期审计AI输出,来应对这些。货币化策略可能涉及向应用开发者授权这些语音模型或创建基于订阅的API,类似于谷歌的Cloud Text-to-Speech服务,根据Alphabet的2023年收益报告,该服务产生了超过10亿美元的收入。从技术上讲,自然发音的语音可能源于神经网络的进步,建立在DeepMind于2016年首次揭晓并在随后几年改进的WaveNet技术基础上。这允许模仿人类语音模式的韵律和语调,减少实时应用中的延迟。多语言扩展涉及在多样化数据集上的训练,可能融入谷歌于2023年宣布的USM(通用语音模型)技术,该模型支持超过300种语言。SynthID的水印确保输出可追踪,通过促进负责任的AI使用来解决伦理含义。在竞争领域,像微软的Azure Cognitive Services(2024年更新)和Nuance(微软于2021年收购)的关键参与者正在推动类似界限,但DeepMind对水印的关注为其在信任构建方面提供了优势。展望未来,这些更新可能深刻影响教育和医疗保健行业,在这些领域,自然的多语言语音合成使个性化学习工具和患者沟通在多样化的语言环境中成为可能。预测表明,到2030年,AI语音技术将为全球GDP贡献15.7万亿美元的提升,根据PwC 2021年报告并使用2023年数据更新。企业应关注混合实施策略,结合本地和云解决方案来克服连接性差地区的带宽挑战。监管考虑将演变,美国联邦AI水印指南可能在2027年出台,继2024年国会听证会的讨论之后。从伦理上讲,最佳实践包括多样化的训练数据以避免偏见,正如DeepMind 2022年伦理框架所强调的。总体而言,这一公告强调了AI在促进包容性创新中的作用,通过定制的企业解决方案呈现货币化途径,并突显了需要强大的治理来缓解音频虚假信息等风险。(字符数:1528)

Google DeepMind

@GoogleDeepMind

We’re a team of scientists, engineers, ethicists and more, committed to solving intelligence, to advance science and benefit humanity.