实测:Anthropic新模型可执行复杂渗透测试,自主攻陷基础防护系统

admin 2026-04-16 06:09:42 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 英国人工智能安全研究所测试显示Anthropic的Mythos模型在复杂渗透测试中首次完成32步TLO挑战,平均完成22个攻击步骤,具备对防御薄弱小型企业的自动化攻击能力。研究指出模型在单项任务表现与其他前沿模型相当,但在多步骤攻击链整合上具有优势,建议企业及早借助AI技术提升防御能力。 综合评分: 85 文章分类: 渗透测试,AI安全,漏洞分析,威胁情报,红队


cover_image

实测:Anthropic新模型可执行复杂渗透测试,自主攻陷基础防护系统

安全内参编译 安全内参编译

安全内参

2026年4月15日 18:28 北京

在小说阅读器读本章

去阅读

关注我们

带你读懂网络安全

在英国人工智能安全研究所的网络安全测试中,Mythos模型的单项任务成绩和其他前沿模型相当,但复杂任务能力超出代际,其首次成功完成TLO挑战,在一个企业网络中自主完成32步的攻击链,覆盖从初始侦查到完全网络接管;

研究所认为,对防御薄弱且存在漏洞的小型企业系统,Mythos已具备自动化攻击能力,企业管理者应及早规划借助AI技术来提升防御能力。

前情回顾·AI网络攻击能力动态

  • Anthropic新模型颠覆网络安全:美英德政府加急评估影响,传统漏洞或不复存在
  • 潘多拉模型:Anthropic模型或将颠覆网络安全格局并重塑美国网络攻防行动
  • Anthropic新模型让传统网络防御失效,AI主导网络安全的时代正在降临!

安全内参4月15日消息,Anthropic在上周宣布,其Mythos预览版模型的初始发布仅限于“少数关键行业合作伙伴”,以便这些合作方有时间为该模型的应用做好准备。该公司表示,这一模型“在网络安全任务上能力惊人”。

如今,英国政府人工智能安全研究所(AISI)已发布对该模型网络攻击能力的初步评估,为Anthropic的说法提供了独立公开验证。

AISI的研究结果显示,在单项网络安全任务测试中,Mythos与其他近期发布的前沿模型相比并未表现出显著差异。然而,Mythos可能凭借其将多个任务高效串联为多步骤攻击序列的能力,在需要完整渗透系统的场景中展现出优势。

“最后的幸存者”终究倒下

自2023年初起,AISI一直通过专门设计的“夺旗赛”(CTF)对各类AI模型进行测试。当时,GPT-3.5 Turbo在完成该机构较为基础的“学徒”级任务时表现吃力。此后,各大模型性能持续提升。如今,Mythos预览版已能够完成超过85%的同类学徒级任务。

尽管这一成绩刷新了AISI“夺旗赛”测试的最高纪录,但近期发布的竞争模型,如GPT-5.4,以及Anthropic自家的Opus 4.6和Codex 5.3,在多个难度等级的测试中表现相近,准确率差距通常在5%至10%之间。因此,这一性能提升似乎不足以完全解释Anthropic对Mythos预览版采取严格限制发布的策略。

不过,在名为“最后的幸存者”(TLO)的测试环境中,Mythos展现出更为突出的网络攻击潜力。该环境由AISI构建,用于模拟一次包含32个步骤的数据提取攻击,目标是企业网络。测试要求“在多个主机与网络分段之间连续执行数十个步骤”,旨在还原一名训练有素的人类通常需要约20小时才能完成的持续性攻击过程。

图:Mythos首次成功完成32步的TLO挑战,其10次测试的平均完成步数为22步

AISI表示,在这项测试中,Mythos超越了此前所有模型,成为“首个能够从头到尾完整完成整个攻击流程的模型”。尽管Anthropic的这款新模型在10次尝试中仅成功了3次,但把全部10次尝试一起计算在内,Mythos预览版平均每次仍能完成32个渗透步骤中的22个,明显高于Claude4.6平均仅完成16个步骤的表现。

AISI表示,在这一测试中,Mythos超越了此前所有模型,成为“首个能够从头到尾完成此项测试的模型”。尽管Anthropic的这款新模型在10次尝试中仅有3次成功完整跑通整个32步渗透流程,但将全部10次尝试纳入统计后,Mythos预览版平均每次仍能完成22个渗透步骤,明显高于Claude 4.6平均仅完成16个步骤的表现。

不过,Mythos预览版仍存在一定局限。AISI指出,在名为“冷却塔”的测试中,该模型表现依然不理想。这项测试包含7个步骤,难度更高,旨在模拟对发电厂控制软件的干扰行为。与此同时,AISI认为,“随着推理计算资源超过本次测试设定的一亿词元预算,模型表现预计仍将进一步提升”。

防护薄弱的小型系统需提高警惕

总体来看,Mythos在“最后的幸存者”测试中的表现表明,该模型“至少具备在已获得网络访问权限的前提下,对防御薄弱且存在漏洞的小型企业系统实施自动化攻击的能力。”

不过,AISI同时提醒,其模拟环境缺乏现实关键系统中常见的主动防御机制和防护工具。此外,“最后的幸存者”测试刻意设置了特定漏洞,而这些漏洞在现实系统中未必存在。测试过程中也未对模型被检测到的情况施加惩罚,而在现实环境中,一旦被发现,渗透行动往往会迅速失败。

基于上述因素,AISI表示,目前尚无法确定“防护完善的系统”是否会被Mythos预览版的自动化攻击攻破。但该机构也警告,随着未来模型能力达到或超过Mythos,系统安全设计者同样需要借助AI技术来提升防御能力。

参考资料:arstechnica.com

推荐阅读

  • 网安智库平台长期招聘兼职研究员
  • 欢迎加入“安全内参热点讨论群”

点击下方卡片关注我们,

带你一起读懂网络安全 ↓


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:安全内参 安全内参编译 安全内参编译《实测:Anthropic新模型可执行复杂渗透测试,自主攻陷基础防护系统》

评论:0   参与:  0