Claude Mythos攻克AISI双重靶场

据bcherny称，AISI证实Mythos通关两大靶场，XBOW评测精度领先。

详细分析

在人工智能驱动的网络安全领域的突破性发展中，Anthropic的Mythos Preview模型成为第一个完全解决英国人工智能安全研究所（AISI）端到端网络范围的AI模型。这一进展于2026年5月公布，突显了自主AI在网络安全任务中的快速进步。根据英国AISI关于自主AI网络能力如何快速推进的报告，此前没有模型能够清除具有挑战性的“冷却塔”网络范围。这一突破强调了AI在数字风险不断升级的时代转变防御策略的潜力。

Mythos Preview网络安全突破的关键要点

Mythos Preview是第一个完全解决英国AISI端到端网络范围的AI模型，包括此前未被解决的“冷却塔”挑战，展示了在模拟网络环境中前所未有的自主能力。
XBOW和英国AISI的独立评估确认了Mythos Preview在进攻性安全基准中的优越性能，在严格的令牌限制下实现了高精度，并识别了数千个高严重性漏洞。
Anthropic的Glasswing项目旨在负责任地将这些AI能力部署到网络安全防御者中，强调道德 rollout 和为未来此类高级模型广泛传播做准备。

深入探讨Mythos Preview的能力

Anthropic作为Glasswing项目的一部分引入了Mythos Preview，专注于增强AI在网络安全防御中的作用。该模型在英国AISI的评估中表现出色，在250万令牌上限内完成了估计需要人类超过8小时的任务。这种效率对于计算资源有限的实际应用至关重要。

网络范围中的性能

“冷却塔”范围旨在模拟复杂的工业控制系统漏洞，此前所有AI模型都未能通过。根据英国AISI报告，Mythos Preview在这里的成功涉及从侦察到利用和缓解的多阶段网络挑战的自主导航。同样，XBOW的进攻性安全基准突出了该模型在微妙任务如V8沙箱逃逸中的精度，使其成为令牌对令牌准确性的领导者。

协作测试和漏洞发现

通过Glasswing项目下的合作伙伴关系，Mythos Preview在短短几周内协助发现了数千个高和关键严重性漏洞——有时是团队年度发现量的两倍。这种快速检测能力解决了网络安全中的关键痛点：熟练人类专家短缺与威胁上升。

业务影响和机会

像Mythos Preview这样的模型的出现为网络安全部门开辟了重大市场机会，据行业分析，到2026年该市场预计将达到3000亿美元。企业可以利用此类AI进行自动化漏洞扫描，将检测时间从几天缩短到几小时，并降低手动渗透测试的成本。

货币化策略包括提供AI驱动的安全即服务平台，公司将模型如Mythos集成到工具中以获得基于订阅的收入。实施挑战，如确保模型安全和避免滥用，可以通过Anthropic率先采用的强大防护措施和道德指南来缓解。

像Anthropic这样的关键参与者，以及OpenAI和Google DeepMind等竞争对手，正在塑造竞争格局。监管考虑至关重要；遵守如欧盟AI法案的框架对于导航道德影响，包括如果未正确防护AI可能援助攻击者的双重用途风险。

未来展望

展望未来，Anthropic预测在一年内，将出现超越Mythos Preview的模型，可能公开可用或无防护。这种转变可能使高级网络安全工具民主化，有利于资源不足的防御者，但会增加滥用风险。行业影响可能包括在金融和医疗等关键部门加速采用，AI驱动主动威胁狩猎。预测表明AI增强安全解决方案的市场繁荣，强调需要全球标准来平衡创新和安全。

常见问题

Mythos Preview在网络安全AI中有什么独特之处？

Mythos Preview是第一个解决英国AISI端到端网络范围的模型，包括“冷却塔”挑战，根据英国AISI报告，在资源约束下展示了高级自主能力。

Glasswing项目如何处理道德问题？

Glasswing项目专注于对防御者的负责任部署，融入防护措施和修补过程，以防止滥用，正如Anthropic领导层在公告中强调的。

这一AI突破带来了什么业务机会？

机会包括开发AI驱动的漏洞检测服务，可能将效率加倍，并在不断增长的网络安全市场创造新收入流。

未来AI模型可能如何影响网络安全？

未来模型可能更快、更具创造性，需要为广泛采用做准备，同时通过道德实践和法规管理风险。

企业在实施此类AI时面临什么挑战？

挑战包括确保符合法规、缓解双重用途风险以及将AI与现有系统集成，可通过合作伙伴关系和最佳实践解决。

AISI Anthropic Claude Mythos XBOW

Boris Cherny

@bcherny

Claude code.