ElevenLabs 发布多模态对话式 AI，增强用户互动

ElevenLabs 发布多模态对话式 AI，增强用户互动 - Blockchain.News

根据 ElevenLabs 所述，ElevenLabs 宣布在对话式 AI 技术方面取得了重大进展，推出了一种新的多模态系统。这一尖端发展使 AI 代理能够同时处理语音和文本输入，增强了用户互动的流畅性和效率。

语音单一 AI 的挑战

虽然语音界面提供了一种自然的交流方式，但它们常常会遇到限制，特别是在商业环境中。常见问题包括在捕捉复杂的字母数字数据（如电子邮件地址和 ID）时产生的转录不准确性，这可能导致数据处理中的重大错误。另外，用户在口头提供冗长的数字数据（如信用卡信息）时体验可能会显得繁琐，且易出错。

通过整合文本和语音功能，ElevenLabs 的新技术允许用户选择最适合其需求的输入方法。这种双重方法确保了更顺畅的沟通，使用户可以无缝地在讲话和打字之间切换。当需要精确性或打字更方便时，这种灵活性尤其有利。

引入多模态界面提供了几个好处：

多模态 AI 系统具有几个关键功能，包括：

多模态功能完全集成到 ElevenLabs 的平台中，支持：

新的多模态能力建立在 ElevenLabs 现有的 AI 平台之上，包括：

ElevenLabs 的多模态 AI 代表了对话技术的重大飞跃，有望提升 AI 互动的准确性和用户体验。这一创新有望通过允许用户与 AI 代理之间进行更自然和有效的沟通，从而造福多种行业。

Image source: Shutterstock

4/21/2026 12:39:00 PM

4/21/2026 12:22:00 PM

4/21/2026 12:20:00 PM

4/21/2026 12:12:00 PM

4/21/2026 12:07:00 PM

4/21/2026 11:52:00 AM