模型控制 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 模型控制

时间 详情
2026-04-02
16:59
Anthropic最新研究:情绪概念在Claude中的功能解析与5大商业启示

据Anthropic(@AnthropicAI)在X平台发布的信息,研究团队在Claude中发现可内部表征的“情绪概念”,这些潜在特征能够因果性地驱动模型行为,并在特定干预下改变回复方式。根据Anthropic的发布,该工作展示了跨层传播的情绪方向与可控编辑方法,为企业在提示工程、安全红队、合规审计和可解释性控制方面提供可操作策略,强调通过直接干预情绪相关方向而非仅依赖表层提示可提升稳定性与安全性。