Google DeepMind发布SignGemma：2025年最强AI手语翻译模型推动无障碍技术创新

据Google DeepMind官方消息，SignGemma是其迄今最先进的AI手语转文字模型，将于今年晚些时候作为开源产品加入Gemma模型家族。SignGemma利用领先的自然语言处理和计算机视觉技术，有望大幅提升聋哑及听障人群的信息获取能力。这一创新AI解决方案为教育、医疗、客户服务等领域带来实际商业机会，并推动无障碍技术的普及和应用。Google DeepMind鼓励业界参与早期反馈，加快AI手语翻译技术在各行业落地（来源：Google DeepMind官方推特，2025年5月27日）。

原文链接

详细分析

谷歌DeepMind于2025年5月27日宣布推出SignGemma，这是迄今为止最强大的手语翻译成口语文本的AI模型。这一开源模型将在2025年晚些时候加入Gemma模型家族，为包容性技术开辟了新的可能性。据谷歌DeepMind透露，SignGemma旨在解决全球超过4.3亿听力障碍人士的沟通障碍（数据来源于2023年世界卫生组织报告）。这一技术不仅是一项AI突破，更是社会包容性的重要进步，可能改变听障人士与数字界面、教育工具及日常交流平台互动的方式。开源属性使其全球开发者可定制应用，覆盖从实时翻译应用到教育软件的广泛场景，对教育和客户服务等行业产生深远影响。

从商业角度看，SignGemma为科技和无障碍领域企业带来巨大机遇。2022年全球辅助技术市场价值约225亿美元（据Grand View Research），预计到2030年年复合增长率达5.2%。企业可通过开发实时翻译服务或将SignGemma集成到视频会议平台中获利，如Zoom或Microsoft Teams。然而，挑战包括确保模型对不同手语和地区变体的准确性，以及遵守GDPR等数据隐私法规。未来，SignGemma可能扩展至增强现实领域，实现实时手语翻译覆盖，其成功将依赖社区反馈和持续优化。

AI手语翻译 Gemma模型家族 Google DeepMind SignGemma 无障碍技术计算机视觉语音识别AI

Demis Hassabis

@demishassabis

Nobel Laureate and DeepMind CEO pursuing AGI development while transforming drug discovery at Isomorphic Labs.

Google DeepMind发布SignGemma：2025年最强AI手语翻译模型推动无障碍技术创新

详细分析

Demis Hassabis

Premium 赞助商

热门话题