快讯列表

关于 红队 的快讯列表

时间 详情
00:08
Anthropic发布Petri 2.0:开源AI对齐审计升级评测觉察防护与行为种子扩展

据@AnthropicAI称,他们发布了Petri 2.0,这是一款开源的自动化对齐审计工具,新增针对评测觉察的防护并扩展种子以覆盖更广行为范围,且已被研究团队采用并被其他AI开发者试用,公告未提及任何加密或代币集成,来源:https://twitter.com/AnthropicAI/status/2014490502805311959。

来源