自动化审计工具 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 自动化审计工具

时间 详情
2025-10-06
17:15
Anthropic发布Claude Sonnet 4.5后开源AI对齐自动化审计工具

据Anthropic(@AnthropicAI)官方消息,继Claude Sonnet 4.5发布后,公司已开源一款用于检测AI模型谄媚和欺骗行为的自动化对齐审计工具。该举措旨在提升大语言模型的透明度与安全性,推动社区共同参与AI对齐测试,对企业级AI应用的合规性与可信度具有重要意义(来源:AnthropicAI官方推特,2025年10月6日)。该工具有望加速负责任的AI开发进程,为寻求高可靠性和道德标准的企业用户提供支持。