AI 快讯列表关于 语音转文字
| 时间 | 详情 |
|---|---|
|
2026-01-13 21:13 |
Google在Hugging Face和Vertex AI推出Med-GEMMA 1.5和MedASR医疗AI模型
根据Sundar Pichai在推特上的消息,Google正式在Hugging Face和Google Cloud的Vertex AI平台发布了Med-GEMMA 1.5和MedASR(来源:Sundar Pichai,2026年1月13日;research.google/blog/next-generation-medical-image-interpretation-with-medgemma-15-and-medical-speech-to-text-with-medasr)。Med-GEMMA 1.5是一款先进的医学影像解读模型,MedASR则专注于高精度的医疗语音转文字。两款AI工具将有助于提升临床工作效率、提高诊断准确性,并推动医疗AI解决方案在科研与商业场景中的应用。通过Hugging Face和Vertex AI的开放,降低了医疗机构和AI开发者的技术门槛,加速了AI医疗创新的落地。 |
|
2025-12-30 17:17 |
ElevenLabs推出Scribe v2 Realtime:先进的语音转文字AI模型赋能Agents平台
据ElevenLabs官方推特账号(@elevenlabsio)发布,ElevenLabs正式推出了Scribe v2 Realtime,这是一款最先进的语音转文字AI模型,现已集成至其Agents平台(来源:x.com/elevenlabsio/status/1988282248445976987)。Scribe v2 Realtime能在150毫秒内实现高精度实时转录,支持90多种语言,包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、印地语和日语。该模型专为AI语音助手、会议记录和实时应用场景设计,为企业在多语言对话式AI和实时语音转写服务领域带来巨大商业机会。Scribe v2 Realtime现已通过API和ElevenLabs Agents平台对外开放(来源:x.com/elevenlabsio/status/1988282248445976987)。 |
|
2025-12-01 17:28 |
Whisper Thunder语音识别AI发布,挑战谷歌市场主导地位
根据Soumith Chintala在Twitter上的信息,Whisper Thunder语音识别AI正式亮相,并表现出色,为市场提供了与谷歌竞争的高质量选择(来源:x.com/runwayml/status/1995493445243461846)。这一进展显示,AI语音转写和语音技术市场正在快速发展。Whisper Thunder的推出为企业带来了更多多样化和高精度的语音转写解决方案,有望推动行业创新和服务降本(来源:twitter.com/soumithchintala/status/1995545465400729860)。 |
|
2025-11-13 18:39 |
ElevenLabs推出Scribe v2 Realtime:超低延迟语音转文字AI助力智能应用
根据ElevenLabs官方推特(@elevenlabsio)消息,ElevenLabs本周发布了Scribe v2 Realtime,这是一款专为智能体应用场景优化的超低延迟语音转文字AI模型。新版本针对语音识别常见的音频质量差、口音多样化以及ID或邮箱等标识符的精准转写难题进行了优化。Scribe v2 Realtime的发布为客户服务自动化、呼叫中心和语音驱动企业应用等领域带来新的商业机会。其更高的转写准确率和实时性能能够帮助企业提升工作效率、降低运维成本,并显著改善用户体验(来源:ElevenLabs推特,2025年11月13日)。 |
|
2025-11-10 19:11 |
Typeless智能语音输入应用重大升级:更智能、更自然的AI语音识别技术
根据@huang_song_的消息,Typeless发布了其AI驱动的语音输入应用的全新版本,显著提升了准确性、上下文理解力和自然语言处理能力。新版本应用更智能、转录更清晰,并通过先进AI模型更好地理解用户意图,生成更自然的文本,极大提升了专业人士和企业的工作效率。这一升级为依赖高精度语音转文字的行业带来了实际的商业机会(来源:@huang_song_)。 |