企业AI安全 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 企业AI安全

时间 详情
2025-10-09
16:28
英国AI安全研究:少量恶意文档可威胁任意大模型,数据投毒风险激增

据Anthropic(@AnthropicAI)与英国AI安全研究院(@AISecurityInst)、艾伦·图灵研究院(@turinginst)联合发布的新研究显示,仅需少量恶意文档即可在任何规模的大语言模型(LLM)中制造安全漏洞。研究证实,数据投毒攻击比以往认为的更为实际和易实施,这对AI开发企业敲响警钟,强调训练数据管理和安全防护的重要性,同时为AI安全解决方案和模型审计服务创造了新的市场机会。(来源:Anthropic, https://twitter.com/AnthropicAI/status/1976323781938626905)

2025-10-06
17:15
Anthropic发布Claude Sonnet 4.5后开源AI对齐自动化审计工具

据Anthropic(@AnthropicAI)官方消息,继Claude Sonnet 4.5发布后,公司已开源一款用于检测AI模型谄媚和欺骗行为的自动化对齐审计工具。该举措旨在提升大语言模型的透明度与安全性,推动社区共同参与AI对齐测试,对企业级AI应用的合规性与可信度具有重要意义(来源:AnthropicAI官方推特,2025年10月6日)。该工具有望加速负责任的AI开发进程,为寻求高可靠性和道德标准的企业用户提供支持。

2025-08-27
11:06
Anthropic报告:恶意行为者利用先进AI能力,推动AI安全防御产业升级

据Anthropic (@AnthropicAI) 披露,恶意行为者正迅速适应并利用人工智能的最新高级能力,用于自动化网络钓鱼、深度伪造生成和大规模信息操控等活动(来源:https://twitter.com/AnthropicAI/status/1960660072322764906)。报告强调,AI企业与行业需加强合作,推动威胁情报共享和AI安全标准化,以提升集体防御能力。随着AI安全需求激增,相关安全解决方案、风险评估及合规服务市场将迎来新一轮增长机遇。