AI 快讯列表关于 Google Cloud
| 时间 | 详情 |
|---|---|
|
2026-04-23 19:55 |
Google 发布 TPU v8t 与 v8i:7 大亮点与训练推理成本分析
据 Jeff Dean 在 X 表示,Google 在 Cloud Next 发布 TPU v8t(面向大规模训练)与 v8i(面向高吞吐推理),并在官方博客披露了芯片细节。根据 Google Cloud 公告,v8t 强调更高带宽互连与更大 HBM 容量以加速大模型训练,v8i 面向低时延与高性价比的推理场景。按照 Google 博客介绍,这两款 TPU 与 Vertex AI 及 JAX、PyTorch 深度集成,帮助企业缩短训练周期并降低总体拥有成本。依据 Google 提供的数据,相比上一代 TPU,新平台在性能每美元与能效上均有提升,使 v8t 适配前沿模型训练、v8i 适配大规模在线服务。对企业而言,据 Google Cloud,总体策略是:将基础模型训练集中到 v8t 机架集群,面向低时延与高并发推理工作负载切换至 v8i,从而优化吞吐与成本结构。 |
|
2026-03-20 16:01 |
Google Cloud整合1吉瓦可调负载:AI数据中心能源管理与电网可靠性的最新分析
据Sundar Pichai在Twitter表示,Google成为首家在长期电力合同中整合1吉瓦可调负载的云服务商,可按需转移或削减数据中心负载,帮助电网进行供需平衡与容量规划。据Pichai发布的信息,此类需求响应能力可将AI训练与推理作业安排在低碳与离峰时段,降低弃风弃光与能源成本,优化超大规模机器学习集群的运维。根据Pichai的说明,这为公用事业带来可预测的负载伙伴关系,催生容量市场、辅助服务与分时电价优化等商业机会,并提升AI数据中心的清洁能源利用率与可靠性。 |
|
2026-02-11 16:30 |
A2A Agent2Agent 协议:DeepLearning.AI 最新短课标准化多代理互操作
据 DeepLearning.AI 称,A2A:Agent2Agent 协议全新短课讲解如何用统一标准让不同框架构建的智能体进行发现与通信,避免定制胶水代码,显著提升生产级多代理互操作性(来源:DeepLearning.AI 在 X)。据 DeepLearning.AI 报道,A2A 与 Google Cloud 合作开发,规范消息格式、服务发现与交接流程,降低异构技术栈的集成周期和运维复杂度(来源:DeepLearning.AI 在 X)。据 DeepLearning.AI 称,这将带来可扩展代理市场、跨厂商编排以及兼容自研与开源代理的企业流程等商业机会,并强化一致性的安全与可观测性(来源:DeepLearning.AI 在 X)。 |
|
2025-10-17 22:55 |
Veo 3.1模型升级:创作者专用增强现实与音频,现已通过Gemini API与Google Cloud上线
根据Sundar Pichai的消息,谷歌已发布升级版Veo 3.1模型,专为内容创作者提供更高的现实感和更丰富的音频体验。该模型现已通过Flow by Google、Gemini应用、Google Cloud Vertex AI及Gemini API上线,进一步拓宽了其在AI内容创作领域的市场覆盖。此举为开发者和企业带来更高质量的多媒体内容生成和更先进的音视频AI工具,有助于提升生产效率和创新能力(来源:@sundarpichai)。 |