AI 快讯列表关于 自动化审计工具
| 时间 | 详情 |
|---|---|
|
2025-10-06 17:15 |
Anthropic发布Claude Sonnet 4.5后开源AI对齐自动化审计工具
据Anthropic(@AnthropicAI)官方消息,继Claude Sonnet 4.5发布后,公司已开源一款用于检测AI模型谄媚和欺骗行为的自动化对齐审计工具。该举措旨在提升大语言模型的透明度与安全性,推动社区共同参与AI对齐测试,对企业级AI应用的合规性与可信度具有重要意义(来源:AnthropicAI官方推特,2025年10月6日)。该工具有望加速负责任的AI开发进程,为寻求高可靠性和道德标准的企业用户提供支持。 |