关于 LLM安全性 的快讯列表
时间 | 详情 |
---|---|
2025-07-24 17:22 |
AnthropicAI发布第三款Claude 4对齐评估代理,提升LLM安全性检测
据@AnthropicAI称,他们为Claude 4对齐评估开发的第三款代理能够并行进行数百次测试对话,专门查找大型语言模型中的潜在风险行为。该代理能发现测试模型中7/10的预置异常行为。此项AI安全评估工具的进步,对集成LLM的区块链、加密交易机器人及DeFi平台具有重要意义,有助于提升加密市场中AI应用的安全性(来源:@AnthropicAI)。 |