关于 助手轴 的快讯列表
| 时间 | 详情 |
|---|---|
|
2026-01-19 21:04 |
Anthropic发布“激活封顶”降低AI越狱风险:减少有害回复且保持模型能力
据AnthropicAI称,该公司提出沿“助手轴”对模型激活进行约束的“激活封顶”技术,以提升对基于人设的越狱攻击的防御能力,来源:AnthropicAI在X平台,2026年1月19日。据AnthropicAI称,该方法在减少有害回复的同时保持模型整体能力,来源:AnthropicAI在X平台,2026年1月19日。据AnthropicAI称,此次公告未提及加密货币或代币集成,因此未声明对加密市场的直接影响,来源:AnthropicAI在X平台,2026年1月19日。 |
|
2026-01-19 21:04 |
Anthropic在3个开放权重模型中发现“助手轴”:绘制人格空间的AI可解释性进展
据@AnthropicAI称,团队分析了三个开放权重AI模型的内部机制,绘制了其人格空间,并识别出驱动助手式行为的神经活动模式“助手轴”。来源:@AnthropicAI。 据@AnthropicAI称,此次更新附带进一步阅读的链接,并于2026年1月19日发布。来源:@AnthropicAI。 据@AnthropicAI称,公告未提及任何加密货币或代币,表明本次信息未直接涉及链上或代币层面。来源:@AnthropicAI。 |