高效AI模型 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 高效AI模型

时间 详情
2025-09-04
16:09
EmbeddingGemma:Google DeepMind发布308M参数本地AI嵌入模型,提升设备端效率

据Google DeepMind官方消息,EmbeddingGemma是一款专为本地AI设计的开放式嵌入模型,仅有3.08亿参数,但实现了业界领先的性能(来源:@GoogleDeepMind,2025年9月4日)。其小巧高效的特性使其可在移动设备与边缘硬件上离线运行,无需依赖互联网连接。EmbeddingGemma为隐私敏感场景、离线推荐系统和设备端个性化应用提供了新的商业机会,有助于满足数据合规和带宽受限环境下的AI需求(来源:@GoogleDeepMind)。

2025-08-15
23:45
谷歌发布Gemma 3 270M:高效开源AI模型助力边缘设备

根据Demis Hassabis在推特上的消息,谷歌推出了Gemma 3 270M开源AI模型。这款超小型模型以高效能和低功耗为特点,特别适合在边缘设备上部署定制的AI系统。该发布顺应了AI在物联网、移动终端和嵌入式系统等资源受限场景下本地化应用的行业趋势,为企业带来了实时智能和业务创新的新机遇(来源:Demis Hassabis,Twitter,2025年8月15日)。

2025-07-04
13:15
微软BitNet b1.58实现1.58比特权重高效AI模型,性能接近主流

据DeepLearning.AI报道,微软及其学术合作伙伴推出了BitNet b1.58更新版,通过将所有线性层权重约束为-1、0或+1,使每个权重仅需约1.58比特存储。在16个涵盖语言、数学与编程的基准测试中,该模型平均准确率达54.2%。这一极致量化方法表明,AI模型在能效优化和边缘设备部署方面的商业潜力巨大,尤其适合资源受限场景(来源:DeepLearning.AI,2025年7月4日)。

2025-06-17
16:01
Gemini 2.5 Pro 与 2.5 Flash 正式发布:高效混合推理AI模型推动企业智能升级

根据Sundar Pichai消息,Gemini 2.5 Pro与Gemini 2.5 Flash现已正式稳定发布,为企业级AI混合推理模型的应用提供了更高性能与可靠性。此外,Pichai还预览了Gemini 2.5 Flash-Lite,这是一款迄今为止速度最快且成本效益最高的2.5系列模型。新模型的发布为企业在大规模部署高效AI解决方案、实现实时分析与推理带来了更多选择和市场机会,尤其适用于对高性能和低成本有需求的行业场景(来源:@sundarpichai,2025年6月17日)。