LLM使用4位FP4精度高效训练：AI模型训练节能新突破

LLM使用4位FP4精度高效训练：AI模型训练节能新突破 | AI快讯详情 | Blockchain.News

据DeepLearning.AI报道，研究人员证实大语言模型（LLM）可采用4位FP4浮点精度进行训练，且不会损失准确率。通过将FP4应用于占训练计算95%的矩阵乘法，模型性能与主流的BF16格式相当。这一AI训练新方法极大降低了计算资源和能耗，为企业级AI部署带来显著成本节约和可扩展性。FP4精度的成功应用为硬件与云服务商优化AI工作负载、推动可持续大规模训练带来了新商机（来源：DeepLearning.AI，2025年5月31日）。

原文链接

详细分析

最近在人工智能训练方法上的突破显示，大型语言模型（LLMs）可以使用4位FP4精度进行训练，而不会牺牲准确性。这一发现可能会显著提升AI模型开发的效率。根据DeepLearning.AI在2025年5月31日发布的信息，研究人员在矩阵乘法中采用了FP4技术，而矩阵乘法占训练计算量的约95%。令人惊讶的是，使用FP4训练的模型性能与采用广泛使用的BF16格式的模型相当。这对依赖AI的行业（如自然语言处理、客户服务自动化和内容生成）具有重要意义，因为它降低了硬件成本壁垒，使更多企业能够参与AI开发。根据MarketsandMarkets的报告，AI市场预计到2025年将达到1906.1亿美元，FP4技术的应用可能进一步推动市场增长。对于中小企业而言，这一技术创新提供了进入AI领域的新机会，同时也为云计算服务商创造了优化训练环境的商机。然而，实施FP4仍面临挑战，包括软件兼容性和硬件支持问题。未来，FP4可能成为可持续AI发展的关键，特别是在降低能耗和确保模型公平性方面。随着NVIDIA等行业巨头的参与，FP4技术有望在2025年后进一步普及。

AI硬件优化 BF16对比 FP4精度企业级部署大语言模型训练能效AI 高效AI模型训练

DeepLearning.AI

@DeepLearningAI

We are an education technology company with the mission to grow and connect the global AI community.