Anthropic的Frontier红队评估网络安全和生物安全中的AI风险

Anthropic的Frontier红队评估网络安全和生物安全中的AI风险 - Blockchain.News

Anthropic的Frontier红队发布了关于前沿AI模型可能带来的国家安全风险的新见解。根据Anthropic的报告，详细介绍了AI能力的快速进步以及相关风险，重点关注网络安全和生物安全。

网络安全中的AI进展

在网络安全领域，AI能力取得了显著的进展。过去一年中，Anthropic的AI模型Claude从高中水平的熟练度提高到了大学本科水平的网络安全技能。这一进展在Capture The Flag (CTF)演习中得到了展示，AI识别和利用软件漏洞的能力显著提高。最新版本Claude 3.7 Sonnet表现出增强的性能，解决了Cybench基准中的大量挑战。

尽管有这些改进，AI模型在更复杂的任务上仍然有困难，比如逆向工程和网络环境利用。然而，与卡内基梅隆大学的合作表明，在专业工具的帮助下，AI可以复制复杂的网络攻击，突显出AI在网络安全攻防角色中的潜力。

生物安全问题

在生物安全方面，Anthropic观察到AI对生物过程理解的快速进步。在一年之内，AI模型在病毒学相关任务中超过了专家基准。然而，与人类专家相比，有些任务对AI而言仍然具有挑战性。

为评估生物安全风险，Anthropic与生物防御专家进行了控制研究。这些研究表明，虽然AI可以帮助新手规划生物武器情景，但它也犯下了关键错误，导致在现实世界中无法成功执行。这凸显了持续监控和制定缓解措施以解决潜在风险的重要性。

合作努力和未来方向

Anthropic与美国AI安全研究所和英国AI安全研究所等政府机构的合作，对于评估AI模型的国家安全影响至关重要。这些合作促进了AI能力的部署前测试，有助于全面了解所涉及的风险。

Anthropic与国家核安全局 (NNSA) 的开创性合作，参与在保密环境中评估AI模型，专注于核和辐射风险。这种合作强调了在其他敏感领域进行类似努力的潜力，体现了公私合作伙伴关系在AI风险管理中的重要性。

展望未来，Anthropic强调需要建立稳健的内部防护措施和外部监督，以确保负责任的AI开发。公司致力于推进AI能力，同时保持对安全和保密的关注，并不断努力完善评估流程和风险缓解策略。

Image source: Shutterstock

Anthropic的Frontier红队评估网络安全和生物安全中的AI风险

网络安全中的AI进展

生物安全问题

合作努力和未来方向

Premium Sponsors

Flash News