AI 快讯列表关于 FP4
| 时间 | 详情 |
|---|---|
|
2026-04-23 20:00 |
Google TPU 8t 重磅升级:单舱121 Exaflops,FP4吞吐较Ironwood提升3倍
据 Jeff Dean 在X平台发布的信息,Google 推出面向大规模训练与推理的 TPU 8t,单个Pod扩展至9600颗芯片,提供约121 Exaflops 的FP4性能,较Ironwood的每Pod 42.5 Exaflops 提升约3倍。根据 Jeff Dean 的说明,聚焦FP4吞吐意味着更低的推理成本与更快的训练速度,适用于超大规模LLM与多模态模型。正如 Jeff Dean 报道所述,此次Pod级扩展将提升数据中心密度与资源利用率,为Google Cloud 客户在模型服务、批量推理与规模化微调等场景带来新的商业机会。 |
|
2026-01-26 16:01 |
Maia 200加速器登陆Azure:2024年AI性能提升30%深度解析
根据Satya Nadella在Twitter上的消息,最新的Maia 200 AI加速器已上线Azure平台,在推理效率方面处于行业领先地位,性价比提升30%。Maia 200拥有超过10 PFLOPS FP4算力、约5 PFLOPS FP8和216GB HBM3e内存,具备7TB/s带宽,专为大规模AI工作负载优化。据Satya Nadella介绍,这一产品丰富了Azure的CPU、GPU及定制加速器组合,为用户提供更快、更具成本效益的AI算力选择。 |