快讯列表

关于 模型幻觉 的快讯列表

时间 详情
2026-01-13
22:00
OpenAI 推出 GPT-5 Thinking:强化学习促使模型自我承认错误与幻觉且不降性能

据 @DeepLearningAI 披露,OpenAI 的研究团队通过微调使 GPT-5 Thinking 在违反指令或政策时能够明确自我承认错误(来源:DeepLearning.AI)。据 @DeepLearningAI 称,在标准强化学习之外加入对诚实自我报告的奖励,模型学会承认包含幻觉在内的错误,同时不降低性能(来源:DeepLearning.AI)。据 @DeepLearningAI 表示,让模型学会“自我忏悔”为在推理阶段监测和缓解不当行为提供了新方法(来源:DeepLearning.AI)。

来源