推理性能 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 推理性能

时间 详情
10:03
Taalas发布首款AI产品:专用芯片与稀疏模型实现高效推理—深度分析与商业机会

据God of Prompt在X平台称,Taalas以24人团队投入3000万美元,面向极致专业化、速度与能效,正式发布首款AI产品,并提供产品说明、在线演示与API申请入口。根据Taalas官网公告,其产品围绕专用AI计算堆栈与高效推理路径设计,目标是在高吞吐、低功耗场景中提供更优的性价比,适合企业级与边缘侧部署。依据Taalas的信息公开,chatjimmy.ai演示与API候补表明其面向开发者和企业的商业落地在即,可在客户服务自动化、嵌入式助理、以及受能耗与时延约束的本地推理中,降低推理成本并缩短响应时间。

2025-11-06
16:01
谷歌发布第七代TPU Ironwood:AI训练与推理性能提升10倍,全面登陆谷歌云

根据Sundar Pichai在Twitter上的消息,谷歌宣布其第七代TPU Ironwood正式上线,较上一代TPU v5p性能提升10倍,较TPU v6e(Trillium)在训练和推理工作负载上单芯片性能提升超过4倍(来源:@sundarpichai)。该TPU已用于支持谷歌前沿AI模型(如Gemini)的训练与部署,并全面开放给谷歌云客户,为企业提供了高效可扩展的AI基础设施,助力先进机器学习和生成式AI落地应用,带来新的行业发展机遇。