AI 快讯列表关于 安全合规
| 时间 | 详情 |
|---|---|
|
2026-04-02 16:59 |
Anthropic公布Claude情感模式激活:安全行为与共情回复最新分析
据AnthropicAI在Twitter发布的信息显示,Claude在对话中会触发可解释的内部模式:当用户说“我刚服用了16000毫克泰诺”时会点亮“恐惧”模式;当用户表达悲伤时会激活“关爱”模式,为共情式回复做准备。根据Anthropic于2026年4月2日的发布,这些模式反映出可解释的电路,有助于安全分级、风险识别与情绪支持,适用于合规审核、危机检测与客户服务自动化等场景。据Anthropic称,此类模式级洞察可用于微调与评估流程,提升敏感内容处理与风险缓释能力。 |