FP4 AI快讯列表

AI 快讯列表

AI 快讯列表关于 FP4

时间	详情
2026-04-23 20:00	Google TPU 8t 重磅升级：单舱121 Exaflops，FP4吞吐较Ironwood提升3倍据 Jeff Dean 在X平台发布的信息，Google 推出面向大规模训练与推理的 TPU 8t，单个Pod扩展至9600颗芯片，提供约121 Exaflops 的FP4性能，较Ironwood的每Pod 42.5 Exaflops 提升约3倍。根据 Jeff Dean 的说明，聚焦FP4吞吐意味着更低的推理成本与更快的训练速度，适用于超大规模LLM与多模态模型。正如 Jeff Dean 报道所述，此次Pod级扩展将提升数据中心密度与资源利用率，为Google Cloud 客户在模型服务、批量推理与规模化微调等场景带来新的商业机会。原文链接
2026-01-26 16:01	Maia 200加速器登陆Azure：2024年AI性能提升30%深度解析根据Satya Nadella在Twitter上的消息，最新的Maia 200 AI加速器已上线Azure平台，在推理效率方面处于行业领先地位，性价比提升30%。Maia 200拥有超过10 PFLOPS FP4算力、约5 PFLOPS FP8和216GB HBM3e内存，具备7TB/s带宽，专为大规模AI工作负载优化。据Satya Nadella介绍，这一产品丰富了Azure的CPU、GPU及定制加速器组合，为用户提供更快、更具成本效益的AI算力选择。原文链接

时间

详情

2026-04-23
20:00

Google TPU 8t 重磅升级：单舱121 Exaflops，FP4吞吐较Ironwood提升3倍

据 Jeff Dean 在X平台发布的信息，Google 推出面向大规模训练与推理的 TPU 8t，单个Pod扩展至9600颗芯片，提供约121 Exaflops 的FP4性能，较Ironwood的每Pod 42.5 Exaflops 提升约3倍。根据 Jeff Dean 的说明，聚焦FP4吞吐意味着更低的推理成本与更快的训练速度，适用于超大规模LLM与多模态模型。正如 Jeff Dean 报道所述，此次Pod级扩展将提升数据中心密度与资源利用率，为Google Cloud 客户在模型服务、批量推理与规模化微调等场景带来新的商业机会。

原文链接

2026-01-26
16:01

Maia 200加速器登陆Azure：2024年AI性能提升30%深度解析

根据Satya Nadella在Twitter上的消息，最新的Maia 200 AI加速器已上线Azure平台，在推理效率方面处于行业领先地位，性价比提升30%。Maia 200拥有超过10 PFLOPS FP4算力、约5 PFLOPS FP8和216GB HBM3e内存，具备7TB/s带宽，专为大规模AI工作负载优化。据Satya Nadella介绍，这一产品丰富了Azure的CPU、GPU及定制加速器组合，为用户提供更快、更具成本效益的AI算力选择。

原文链接