AI 快讯列表关于 人工智能风险管理
| 时间 | 详情 |
|---|---|
|
2025-10-09 16:28 |
英国AI安全研究:少量恶意文档可威胁任意大模型,数据投毒风险激增
据Anthropic(@AnthropicAI)与英国AI安全研究院(@AISecurityInst)、艾伦·图灵研究院(@turinginst)联合发布的新研究显示,仅需少量恶意文档即可在任何规模的大语言模型(LLM)中制造安全漏洞。研究证实,数据投毒攻击比以往认为的更为实际和易实施,这对AI开发企业敲响警钟,强调训练数据管理和安全防护的重要性,同时为AI安全解决方案和模型审计服务创造了新的市场机会。(来源:Anthropic, https://twitter.com/AnthropicAI/status/1976323781938626905) |
|
2025-09-22 13:12 |
Google DeepMind推出前沿安全框架,引领下一代AI风险管理新标准
据Google DeepMind官方消息,该公司推出了最新的前沿安全框架,旨在主动识别和应对更强大AI模型带来的新兴风险(来源:@GoogleDeepMind,2025年9月22日)。这一框架是其迄今为止最全面的AI安全方案,涵盖先进的监测工具、严格的风险评估流程和持续的评估机制。该举措为AI产业树立了责任开发的新标准,为企业在AI治理与合规解决方案领域带来新的市场机遇。前沿安全框架有望推动行业最佳实践,并为专注于AI伦理、安全审计和合规服务的企业创造增长空间。 |
|
2025-05-26 18:42 |
AI安全挑战:Chris Olah指出全球在人工智能风险管理上的智力短板
据Chris Olah(@ch402)在2025年5月26日推特发布的信息,人类在AI安全问题上未能充分发挥其智力优势,这被认为是一个严重的失误(来源:Twitter)。这反映出当前AI技术快速发展与全球对安全研究重视不足之间的差距。AI行业企业和初创公司应重视AI安全研究与合作机制,这不仅是责任,也是布局可信人工智能的重要商业机会。 |