2026-04-21 01:30:16 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文聚焦Anthropic公司在AI安全领域的战略定位及其与美国国防部的法律冲突。作为公共利益公司，Anthropic坚持禁止AI用于大规模监控和完全自主致命武器的伦理红线，并因此拒绝国防部解除使用限制的要求，导致被列为供应链风险并遭封杀。同时，公司通过发布MythosPreview模型及银翼计划，展示了AI在自主挖掘0day漏洞方面的强大能力，凸显了AI作为安全基础设施的战略价值，并引发行业对AI技术边界与控制权的深度思考。 综合评分： 85 文章分类： AI安全,政策法规,安全大事件,漏洞分析,安全建设

cover_image

【AI】Anthropic：在安全与强权之间，定义 AI 的边界

原创

fxe00 fxe00

凌霜雁安全志

2026年4月20日 10:25 湖北

在小说阅读器读本章

去阅读

Anthropic 旗下拥有全球顶级的大模型 Claude，近期又在网络安全领域掀起巨大波澜。其于 4 月 7 日发布的 Mythos Preview 模型，宣称能够自主挖掘出数千个 0day 漏洞，并同步推出了银翼计划（Project Glasswing）。出于对这家公司理念与发展路径的好奇，我开始思考：为何一家主打通用大模型的公司，会如此着重强调模型在安全能力上的突破，以及其在安全领域的重要意义。

深入了解后我发现，这一切都根植于 Anthropic 自身的定位与核心使命。正如其官网所言：“AI will have a vast impact on the world. Anthropic is a public benefit corporation dedicated to securing its benefits and mitigating its risks.” 作为一家公共利益公司，它从成立之初就以让 AI 安全可控、趋利避害为核心目标，持续深耕 AI 安全、构建防御性能力，就是其路线的自然延伸。

因为这份坚守，让 Anthropic 当下深陷与美国国防部的激烈冲突，甚至被贴上 “供应链风险”“威胁国家安全” 的制裁标签。矛盾的根源在于五角大楼的要求与公司伦理底线难以调和：美国国防部要求其为军事情报场景提供的 AI 模型，必须在 “所有合法用途” 范围内解除一切使用限制，但 Anthropic 则认为现在 AI 的能力还不能稳定可靠到直接用于军事作战中，并始终坚持两条不可退让的红线 —— 禁止用于大规模监控、禁止用于完全自主致命武器，并因此拒绝了国防部的要求，最终被美国国防部打上了 “供应链风险” 的标签。

不得不说，Anthropic 是家硬汉公司，敢于为了公司底线和政府硬刚。了解这些是为了让我们这些安全从业人员更加能够认清在 AI 极速发展的当下，AI 并不是为了取代我们工具，而是协助我们研判、协助我们减少安全风险的利剑，我们更应该减少内耗，拥抱新技术带来的新发展。

接下来我们让 AI 帮忙梳理 Anthropic 与五角大楼的事件起末：

一、合作起点：2025 年 7 月 —— 2 亿美元国防合同

2025 年 7 月（公告约在 7 月 14–15 日前后），美国国防部通过 CDAO，向 Anthropic、OpenAI、Google、xAI 四家公司，各授予一份上限 2 亿美元、为期两年的原型合同（POTA），目的是把前沿生成式 AI 引入军事与战略行动。

Anthropic 从一开始就白纸黑字写了两条伦理红线：

•禁止用于美国国内大规模监控•禁止用于完全自主致命武器

彼时，Claude 已是唯一进入美军涉密网络的商业大模型，可处理最高级敏感情报。

二、矛盾爆发：2026 年 1 月 —— 国防部提出 “无限制军用” 要求

2026 年 1 月 9 日，美国国防部发布新版《国防部人工智能战略》，提出 “AI 优先” 作战力量；1 月 12 日，国防部长 Hegseth 公开放话：“责任 AI，意味着不能用那些不让你打仗的 AI 模型。”

核心要求：军用 AI 必须能在任何合法用途下使用，不受任何限制合法军事用途的政策约束 —— 本质是要求 Anthropic 彻底取消伦理限制，把 Claude 变成军方 “无禁区工具”。

三、摊牌时刻：2026 年 2 月 —— 最后通牒与正面交锋

•2 月 5 日：Anthropic 发布 Claude Opus 4.6，同日其红队公开研究报告，称在开源软件中挖出 500+ 高危漏洞，其中不少是存在多年、专家未发现的老漏洞。•2 月 20 日：正式推出 Claude Code Security，主打代码漏洞扫描与自动补丁建议，直接冲击传统安全厂商，引发行业震动。•2 月 24 日：Hegseth 直接与 Anthropic CEO Amodei 闭门会晤，口头下达最后通牒：必须在 2 月 27 日 17:01（美东时间）前解除所有军用限制，否则将被列为 “供应链风险”，全面封杀。•2 月 26 日：Amodei 公开发文，正式拒绝军方要求：“当今 AI 可靠性不足以支撑完全自主武器。”•2 月 27 日：最后通牒到期，Anthropic 未妥协。特朗普随即在社交平台下令：所有联邦机构立即停用 Anthropic 技术；国防部同步发出供应链风险认定书，标签正式生效，要求所有与国防部合作的承包商（含微软、亚马逊、Palantir 等）证明其业务中未使用 Claude。

四、法律对抗与内部风波：2026 年 3 月

•3 月 9 日：Anthropic 在旧金山联邦法院和华盛顿特区上诉法院分别提起诉讼，指控政府行为属于违宪报复。

•3 月 26 日：两件事同日发生

•旧金山联邦法院法官 Rita Lin 批准初步禁令，认定政府封杀是 “典型的第一修正案报复”，非国防部联邦机构可恢复使用 Claude；•Anthropic CMS 配置失误，约 3000 份内部未发布文件（含 Mythos/Capybara 模型草稿）被公开访问，随后修复。Anthropic 确认原因为人为配置错误，与政府纠纷无关。

•3 月 31 日：Claude Code CLI v2.1.88 发布时，误将完整 TypeScript 源码（约 51 万行、1906 个文件）打包进公开 npm 包，数小时内被研究者发现并广泛传播。Anthropic 确认为打包配置错误，非安全入侵，已发 DMCA 下架通知。

五、安全能力全面爆发：2026 年 4 月 —— Mythos 与银翼计划

•4 月 7 日：Anthropic 发布 Mythos Preview，同步启动 Project Glasswing（银翼计划）。官方宣称 Mythos 已在主流操作系统、浏览器中挖出数千个 0day 漏洞，其中大量为严重高危漏洞。访问权限仅开放给 AWS、Apple、Google、Microsoft、Cisco、CrowdStrike 等 12 家核心合作方及约 40 家扩展机构，不对公众开放。这是 Anthropic 从 “通用 AI” 向 “AI 驱动安全” 战略升级的公开信号。•4 月 8 日：华盛顿特区联邦上诉法院做出相反裁决，驳回 Anthropic 暂停国防部封杀令的请求，维持 “供应链风险” 标签。

至此，美国司法系统出现分裂判决：加州禁令 “松绑民用”，DC 上诉法院 “维持军用封杀”，双方进入长期法律拉锯。

六、最新进展：2026 年 4 月 18 日 —— 白宫与 Amodei 闭门会谈

据 Axios 独家报道，4 月 18 日，美国财政部长与白宫办公厅主任与 Anthropic CEO Amodei 举行闭门会谈，试图在 “封杀僵局” 与 “AI 安全红线” 之间寻找折中方案。谈判结果尚未公开。

这场博弈还没有结束。法庭上的拉锯仍在继续，白宫的闭门谈判尚无定论，而 Mythos 挖出的数千个 0day 还在等待修复。但有一件事已经清晰：Anthropic 用一场与全球最强政府的正面冲突，完成了一次最昂贵的价值声明。

从 2 亿美元合同到 “供应链风险” 标签，从 500+ 漏洞研究到 Mythos Preview 的受限发布，Anthropic 的每一步都在践行同一个逻辑：AI 能力越强，边界就越重要。 这不是软弱，而是一家真正理解自己在造什么的公司，才会有的清醒。

这场博弈的走向，短期内很难乐观。五角大楼不会轻易放弃对 AI 工具的完整控制权，Anthropic 也不太可能在核心红线上松口。更大的可能是：双方在法院判决的压力下，找到某种技术上可行、政治上可接受的折中 —— 但那两条红线本身，大概率会以某种形式保留下来，因为它们早已不只是一家公司的立场，而是整个行业正在形成的基准。

对我们这些安全从业者来说，这件事的意义不只是一桩商业纠纷。它提醒我们：AI 正在成为安全领域最核心的基础设施，而谁来定义它的边界，将直接决定它最终服务于谁。 Mythos 能在数周内挖出人类数十年未发现的漏洞，这种能力落在防御者手中是福，落在没有约束的地方则是另一回事。

所以，无需焦虑 AI 会不会取代安全工程师，我们应该先想清楚：我们希望这把剑握在谁手里，指向哪里。Anthropic 给出了它的答案，代价是实实在在的，我们这个行业，也该有自己的答案。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：凌霜雁安全志 fxe00 fxe00《【AI】Anthropic：在安全与强权之间，定义 AI 的边界》