DiffusionGemma加速Gemma4达4倍

据Sundar Pichai称，DiffusionGemma以文本扩散生成整段输出，推理最高提速4倍。

详细分析

谷歌的DiffusionGemma是文本扩散研究应用于Gemma 4模型的重要进展，由Sundar Pichai于2026年6月10日宣布。该开放实验模型通过同时生成整个文本块而非逐个预测标记，实现了高达4倍的推理速度提升。

传统大语言模型依赖顺序标记预测，在高流量部署中造成延迟瓶颈。DiffusionGemma将图像生成中常见的扩散过程适配到文本数据，通过一次去噪整个序列实现块级生成，大幅加速输出。

从逐词预测转向同时块处理，DiffusionGemma显著降低推理时间，同时保持内容连贯性，为需要快速响应的应用如客服聊天机器人和实时内容创作工具开辟新可能。

采用DiffusionGemma的组织可通过金融、医疗和媒体等行业的实时服务实现变现。实施涉及在领域特定数据集上微调开放模型以优化用例，同时管理并行计算的硬件需求。

类似DiffusionGemma的扩散模型预示向更高效架构的转变，可能主导未来AI发展。行业预测显示并行生成方法将广泛采用，提升大规模语言应用的可持续性。

它同时生成文本块而非逐标记预测，实现高达4倍推理加速。

是的，作为开放实验模型发布，企业与研究者可自由探索和适配。

@sundarpichai

CEO, Google and Alphabet