AI 快讯列表关于 大语言模型微调
| 时间 | 详情 |
|---|---|
|
2025-10-28 15:59 |
DeepLearning.AI携手AMD推出LLM微调与强化学习高级课程:后训练实战指南
根据DeepLearning.AI(@DeepLearningAI)消息,DeepLearning.AI联合AMD与知名讲师Sharon Zhou(@realSharonZhou)推出了《LLM微调与强化学习:后训练入门》新课程。该课程聚焦于如何将预训练大语言模型(LLM)通过后训练技术转化为开发者助手、智能客服、AI助理等高可靠性系统。课程通过五大模块,深入讲解微调、RLHF(基于人类反馈的强化学习)、奖励建模、PPO、GRPO、LoRA等主流技术,并涵盖评估方法设计、奖励机制漏洞检测、数据集准备与合成数据生成、生产级部署管道与反馈机制。此课程紧贴行业对LLM后训练与强化学习实操型人才的需求,为AI解决方案企业和应用开发商带来实质性商业机会(来源:DeepLearning.AI,2025年10月28日)。 |
|
2025-05-24 00:00 |
DeepLearning.AI与Predibase联合推出GRPO强化学习LLM微调短课程
根据DeepLearning.AI的官方信息,其与Predibase合作推出了《使用GRPO强化微调LLM》短课程,重点讲解了强化学习基础知识及Group Relative Policy Optimization(GRPO)算法在大语言模型(LLM)微调中的实际应用。该课程为AI从业者提供系统的GRPO实操指导,帮助企业和技术团队掌握高效、可扩展的LLM微调方法,满足企业级AI部署对模型性能和定制化的需求(来源:DeepLearning.AI官方Twitter,2025年5月24日)。 |