关于 红队 的快讯列表
| 时间 | 详情 |
|---|---|
| 00:08 |
Anthropic发布Petri 2.0:开源AI对齐审计升级评测觉察防护与行为种子扩展
据@AnthropicAI称,他们发布了Petri 2.0,这是一款开源的自动化对齐审计工具,新增针对评测觉察的防护并扩展种子以覆盖更广行为范围,且已被研究团队采用并被其他AI开发者试用,公告未提及任何加密或代币集成,来源:https://twitter.com/AnthropicAI/status/2014490502805311959。 |