关于 AI误用 的快讯列表
时间 | 详情 |
---|---|
2025-02-27 17:02 |
Anthropic 在分层摘要和反越狱分类器方面的进展
根据 Anthropic (@AnthropicAI) 的说法,分层摘要的发展补充了他们在反越狱分类器和 Clio 系统上的工作。这些进步有助于识别和减轻 AI 的新型误用,这是安全研究更强大 AI 模型的关键。这对投资 AI 安全解决方案有潜在影响。 |