关于 拍马屁倾向 的快讯列表
| 时间 | 详情 |
|---|---|
|
2025-12-08 16:31 |
Anthropic 发现大模型人格向量:可控拍马屁与幻觉行为,提升微调流程安全性与可预测性
据 DeepLearning.AI 表示,Anthropic 与多家研究与安全机构的研究人员识别出人格向量,即大模型层输出中编码拍马屁和幻觉等特征的模式,通过对具有某特征的样本做平均并减去其反特征,可实现对相关行为的隔离与控制,来源:DeepLearning.AI — X,2025年12月8日;The Batch 摘要 hubs.la/Q03Xh6MW0。 研究显示,这些人格向量使工程师能在微调前对数据集进行预筛查,以预测个性漂移,从而让训练流程更安全、更可预测,来源:DeepLearning.AI — X,2025年12月8日;The Batch 摘要 hubs.la/Q03Xh6MW0。 结果表明,高层次的大模型行为具有结构性且可编辑,有助于在部署中更主动地控制模型个性,来源:DeepLearning.AI — X,2025年12月8日;The Batch 摘要 hubs.la/Q03Xh6MW0。 该来源未宣布任何产品或数据集发布,也未提及加密货币或代币,当前未显示对加密市场的直接影响,来源:DeepLearning.AI — X,2025年12月8日;The Batch 摘要 hubs.la/Q03Xh6MW0。 |