AI 快讯列表关于 大模型训练
| 时间 | 详情 |
|---|---|
|
2025-10-23 20:38 |
Anthropic宣布2026年将扩展使用谷歌TPU,锁定100万台TPU与超1吉瓦算力
据Anthropic官方推特(@AnthropicAI)发布,Anthropic宣布计划在2026年大规模扩展其谷歌TPU的使用,锁定约100万台TPU与超1吉瓦算力。此举旨在显著提升其AI模型训练和部署能力,满足企业对生成式AI和大模型服务日益增长的需求。这一战略投资凸显了AI基础设施超大规模扩展的行业趋势,同时也反映出高效能算力对推动AI商业化应用和基础模型研发的重要性(来源:AnthropicAI官方推特,2025年10月23日)。 |
|
2025-10-13 17:50 |
OpenAI推出自研AI芯片,满足全球AI需求——第8期OpenAI播客深度解读
据@OpenAI官方消息,在第8期OpenAI播客中,@sama和@gdb与博通高管共同宣布,OpenAI正基于自身前沿AI模型开发经验,自主设计AI专用芯片。这一举措旨在应对全球持续增长的人工智能需求,通过软硬件深度融合提升AI性能,并降低对第三方芯片供应商的依赖。OpenAI自研芯片不仅将加速大模型训练,提高成本效益,还为AI硬件市场带来新的商业机会,为企业级AI部署提供更强竞争力(来源:@OpenAI,OpenAI播客,2025年10月13日)。 |
|
2025-10-09 16:22 |
微软部署4600+颗NVIDIA GB300 GPU超级计算集群,加速下一代AI应用
据Satya Nadella透露,微软已部署基于NVIDIA GB300 GPU、配备4600多颗GPU和新一代InfiniBand互连的超级计算集群(来源:Satya Nadella推特)。微软计划在全球数据中心扩展至数十万颗GB300,并重构从芯片、系统到软件的全栈架构,以满足下一代AI工作负载需求。这一举措有助于微软在大规模AI模型训练和生成式AI应用的企业与科研市场中占据领先地位。 |
|
2025-09-01 21:00 |
Mistral发布Mistral Large 2 AI模型18个月全生命周期环境影响分析报告
根据DeepLearning.AI报道,Mistral公司公布了Mistral Large 2 AI模型的18个月全生命周期分析,详尽衡量了温室气体排放、能源消耗、水资源利用及材料消耗。报告涵盖数据中心建设、硬件制造、模型训练与推理等环节,为企业提供AI大模型环境影响评估标准,有助于推动可持续AI实践和绿色数据基础设施建设(来源:DeepLearning.AI,2025年9月1日)。 |
|
2025-08-27 04:16 |
Google在Hot Chips 2025发布TPUv7“Ironwood”:每个Pod 9216颗芯片、支持AI多泽塔级算力
根据Jeff Dean在Twitter上的消息,Google的Norm Jouppi和Sridhar Lakshmanamurthy在Hot Chips 2025大会上正式发布了TPUv7“Ironwood”系统。该系统每个Pod集成9216颗芯片,单Pod可实现42.5 exaflops的fp8算力,并可通过多Pod扩展达到多泽塔级AI计算能力。TPUv7的超强扩展性和高性能为大规模AI训练、生成式AI模型及企业级AI应用提供了坚实的基础,进一步巩固了Google Cloud在AI基础设施市场的领先地位,助力企业加速深度学习和大模型研发(来源:Jeff Dean 推特)。 |
|
2025-07-31 16:24 |
2025年中国AI加速发展:行业动态与全球商业机遇深度解析
根据DeepLearning.AI报道,Andrew Ng指出中国AI发展势头迅猛,推动全球AI竞争与创新加速。阿里巴巴发布Qwen3系列模型升级,推动企业级AI应用落地。同时,美国取消对中国高性能GPU的出口禁令,有望提升中国企业硬件获取与大模型训练能力(来源:DeepLearning.AI,2025年7月31日)。白宫则重置美国AI政策,强化负责任的AI部署与国家竞争力。这些新动向为AI解决方案供应商带来跨境合作和数字化转型的商业机会。此外,Ng还提及一项研究显示,AI陪伴产品可能影响用户幸福感,提示消费级AI产品需加强伦理考量。 |