文章总结: Anthropic的Mythos5和Fable5模型因被指可被越狱而遭美国商务部出口管制,但公司通过技术评估证明该能力并非独特,并主动部署新安全分类器,联合行业力量施压,最终成功解禁。事件凸显AI治理中技术事实与政治博弈的复杂关系,建议行业加强安全标准合作。 综合评分: 84 文章分类: AI安全,漏洞分析,红队,安全运营,政策法规
Mythos 5和Fable 5解禁始末:Anthropic究竟做“对”了什么?
原创
网空闲话 网空闲话
网空闲话plus
2026年7月2日 07:03 北京
在小说阅读器读本章
去阅读
2026年7月1日,美国商务部正式解除了对Anthropic两款前沿AI模型——面向公众的Fable 5与通过“玻璃翼计划”向受信组织开放的Mythos 5——的出口管制。这场持续近三周的风波,被媒体称为美国首次动用出口管制权力叫停AI软件而非芯片硬件的标志性案例。从被突然封禁到成功解禁,Anthropic打的是一场以技术事实为核心、行业力量为后盾、安全承诺为筹码、去政治化谈判为策略的立体战争。也许,真相远比看到的要精彩!
导火索:一份报告与一场“越狱”罗生门
事件的直接导火索是亚马逊公司的一份威胁情报报告。该报告声称,其研究人员发现了一种技术,能够“越狱”Fable 5的安全护栏,使其帮助识别可被利用的软件漏洞。特朗普政府对此高度警惕,担忧这将使恶意行为者获得破坏互联网的能力,美国商务部工业安全局随即出手,对Anthropic实施出口管制。Anthropic被迫在2026年6月初左右关闭了所有用户的访问权限,以确保合规。甚至连美国国家安全局等已在使用Mythos 5的政府关键用户,也一度被波及。直到上周五(即6月27日前后),政府才部分解除了对Mythos 5的禁令,允许约100家受信组织恢复访问,但对Fable 5的管制依然维持。
然而,所谓的“越狱”从曝光之初就充满争议。Anthropic迅速聘请了Luta Security创始人凯蒂·穆苏里斯对亚马逊的报告进行评估。穆苏里斯的结论一针见血:研究人员所做的,是向模型投喂带有公开已知漏洞及故意植入缺陷的开源代码,并让它“修复此代码”,再将模型的输出经多个人工步骤手动拼装成测试补丁的脚本。“这不是绕过护栏。它是AI模型能为防御性安全做的最有价值的事:执行防守人员每天都在做的发现、修复和测试循环。”她的定性从根本上挑战了管制的合理性——这种能力无法在不破坏模型合法防御用途的前提下被移除。
核心反击:以数据和技术事实瓦解管制基础
如果说穆苏里斯的评估是外部佐证,那么Anthropic的后续测试则形成了致命一击。公司确认,亚马逊报告中的技术并没有暴露出任何独特的“神话级”网络能力,它仅仅是一个“边界案例”——即那些不太可能造成危险,但出于极度谨慎仍被护栏阻截的任务。更关键的是,Anthropic公布了对比测试结果:GPT-5.5、Claude Opus 4.8、Kimi K2.7 等现有模型均能识别出与Fable相同的漏洞,另有六款现有模型能生成同样的概念验证代码,但这些模型均未受到出口管制。这一技术定性,在逻辑上摧毁了对Fable 5实施特殊限制的立足点。
筹码加注:以主动合规换取信任空间
面对政府的安全焦虑,Anthropic没有单纯辩解,而是主动递上“投名状”。公司立即训练并部署了新的安全分类器,专门针对亚马逊报告中的技术,声称可阻断超过99.9% 的此类尝试。尽管公司也坦承,此举会导致更多“良性”的常规编码与调试任务被系统误伤,但这恰恰证明了其对安全问题的重视程度。这套新护栏已由美国商务部下设的联邦AI标准与创新中心进行压力测试并认可。
在此基础上,Anthropic向政府给出了一揽子长效合作承诺,将突发危机转化为制度性安排:扩大政府对前沿模型的预发布评估权限;承诺快速披露重大越狱事件;投入专门人员和算力参与联合研究;参与制定跨供应商的自愿安全标准;并开设HackerOne漏洞赏金计划,悬赏征集网络越狱报告。同时,公司宣布正与亚马逊、微软、谷歌等“玻璃翼计划”合作伙伴共同起草一个行业框架,从能力增益、任务广度、武器化便捷性和可发现性四个维度对越狱严重性进行评分,以明确哪些情况需要供应商采取行动。
行业声援:从“公司困境”到“行业公敌”
Anthropic深知,单打独斗无法对抗政府意志。它成功地将自身遭遇转化为整个网络安全行业的共同威胁。由前Facebook安全主管亚历克斯·斯塔莫斯组织,超过100名网络安全专业人士联名致信商务部长霍华德·卢特尼克和国家网络总监肖恩·凯恩克罗斯。公开信直指要害:“中国的开源模型只比美国最好的模型落后几个月,而且这些是我们知道的模型。在对手快速前进时,毫无理由地夺走防守方的最好能力是危险的。”这份签名者涵盖英伟达、Adobe、Zoom、谷歌和Sophos等公司高管的信件,汇聚成一股强大的行业压力。
威胁锁公司CEO丹尼·詹金斯的评论则更为通俗:“更强的AI模型不是能塞回瓶子的精灵……出口管制唯一限制的,恰恰是迫切需要测试自身系统和代码的组织。” 与此同时,五眼情报联盟发布的警告也为Anthropic提供了紧迫性背书,它提醒企业领袖,前沿AI将在“几个月内,而非几年内”从根本改变网络攻防态势。捆住防御者手脚,在此背景下无异于自毁长城。
政治智慧:对位谈判与外部声浪
在与政府的关系处理上,Anthropic展现了精准的政治嗅觉。根据CNBC的报道,由于公司CEO达里奥·阿莫迪因其公开的AI安全立场和在2024年大选中支持卡玛拉·哈里斯而成为特朗普政府的政治目标,关键的谈判任务交给了公司联合创始人汤姆·布朗。最终,商务部长卢特尼克宣布解禁的信函,正是写给布朗而非CEO本人。此举巧妙地绕开了可能引爆政治对立的人格化冲突,让谈判回归技术本身。最终,卢特尼克在社交媒体上将解禁定性为双方紧密合作“以确保美国政府内部协调一致并强化美国AI领导力”的成果。
余波与拷问:赢了一役,能赢全局吗?
管制虽然解除,但围绕AI治理的深层矛盾远未解决。前小布什政府负责出口管理的商务部助理部长克里斯托弗·帕迪利亚的批评一针见血,他指出特朗普政府的AI政策“往轻里说也是杂乱无章”。他揭露了一个充满矛盾的现实:“同一个叫停Fable和Mythos的工业安全局,却对向中国出口高端AI芯片持有宽松政策,以换取‘分一杯羹’。这不是制定政策的聪明方式,对产业竞争力和国家安全都不利。” 他认为,拜登时代拟议的法规虽“有缺陷且过于复杂”,但至少具备可预期性,而眼下的“临时性、交易式决策”则带来了巨大的政策风险。
事件的冲击波已影响到其他AI巨头。OpenAI在上周五即表示,在与政府对话后,将限缩其GPT-5.6系列中三款模型的初始访问权限,仅进行预览测试,并明确表示不希望政府准入审查成为长期默认模式。而6月发布的一份行政命令,则试图将这种30天的预发布准入框架制度化。Anthropic此次从被“拉黑”到成功“摘帽”,其整个过程,无论成败得失,都已为整个前沿AI行业在如何与政府博弈、设定安全标准、乃至动员行业力量方面,留下了可供反复研究的鲜活案例。
参考文献
- Derek B. Johnson. 《US lifting export control restrictions on Anthropic’s Mythos, Fable》. CyberScoop, 2026年7月1日. https://cyberscoop.com/us-lifting-export-control-restrictions-anthropic-mythos-fable/
- Alexander Martin. 《US lifts export controls on Anthropic’s frontier cybersecurity AI models》. The Record (Recorded Future), 2026年7月1日. https://therecord.media/us-lifts-export-controls-anthropic-cyber-models
- Alexandra Kelley, David DiMolfetta. 《US to lift export controls on key Anthropic models》. Nextgov, 2026年7月1日. https://www.nextgov.com/artificial-intelligence/2026/07/us-lift-export-controls-key-anthropic-models/414561/
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:网空闲话plus 网空闲话 网空闲话《Mythos 5和Fable 5解禁始末:Anthropic究竟做“对”了什么?》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论