【AI】Anthropic:在安全与强权之间,定义AI的边界

admin 2026-04-21 01:30:16 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文聚焦Anthropic公司在AI安全领域的战略定位及其与美国国防部的法律冲突。作为公共利益公司,Anthropic坚持禁止AI用于大规模监控和完全自主致命武器的伦理红线,并因此拒绝国防部解除使用限制的要求,导致被列为供应链风险并遭封杀。同时,公司通过发布MythosPreview模型及银翼计划,展示了AI在自主挖掘0day漏洞方面的强大能力,凸显了AI作为安全基础设施的战略价值,并引发行业对AI技术边界与控制权的深度思考。 综合评分: 85 文章分类: AI安全,政策法规,安全大事件,漏洞分析,安全建设


cover_image

【AI】Anthropic:在安全与强权之间,定义 AI 的边界

原创

fxe00 fxe00

凌霜雁安全志

2026年4月20日 10:25 湖北

在小说阅读器读本章

去阅读

Anthropic 旗下拥有全球顶级的大模型 Claude,近期又在网络安全领域掀起巨大波澜。其于 4 月 7 日发布的 Mythos Preview 模型,宣称能够自主挖掘出数千个 0day 漏洞,并同步推出了银翼计划(Project Glasswing)。出于对这家公司理念与发展路径的好奇,我开始思考:为何一家主打通用大模型的公司,会如此着重强调模型在安全能力上的突破,以及其在安全领域的重要意义。

深入了解后我发现,这一切都根植于 Anthropic 自身的定位与核心使命。正如其官网所言:“AI will have a vast impact on the world. Anthropic is a public benefit corporation dedicated to securing its benefits and mitigating its risks.” 作为一家公共利益公司,它从成立之初就以让 AI 安全可控、趋利避害为核心目标,持续深耕 AI 安全、构建防御性能力,就是其路线的自然延伸。

因为这份坚守,让 Anthropic 当下深陷与美国国防部的激烈冲突,甚至被贴上 “供应链风险”“威胁国家安全” 的制裁标签。矛盾的根源在于五角大楼的要求与公司伦理底线难以调和:美国国防部要求其为军事情报场景提供的 AI 模型,必须在 “所有合法用途” 范围内解除一切使用限制,但 Anthropic 则认为现在 AI 的能力还不能稳定可靠到直接用于军事作战中,并始终坚持两条不可退让的红线 —— 禁止用于大规模监控、禁止用于完全自主致命武器,并因此拒绝了国防部的要求,最终被美国国防部打上了 “供应链风险” 的标签。

不得不说,Anthropic 是家硬汉公司,敢于为了公司底线和政府硬刚。了解这些是为了让我们这些安全从业人员更加能够认清在 AI 极速发展的当下,AI 并不是为了取代我们工具,而是协助我们研判、协助我们减少安全风险的利剑,我们更应该减少内耗,拥抱新技术带来的新发展。

接下来我们让 AI 帮忙梳理 Anthropic 与五角大楼的事件起末:

一、合作起点:2025 年 7 月 —— 2 亿美元国防合同

2025 年 7 月(公告约在 7 月 14–15 日前后),美国国防部通过 CDAO,向 Anthropic、OpenAI、Google、xAI 四家公司,各授予一份上限 2 亿美元、为期两年的原型合同(POTA),目的是把前沿生成式 AI 引入军事与战略行动。

Anthropic 从一开始就白纸黑字写了两条伦理红线:

•禁止用于美国国内大规模监控•禁止用于完全自主致命武器

彼时,Claude 已是唯一进入美军涉密网络的商业大模型,可处理最高级敏感情报。


二、矛盾爆发:2026 年 1 月 —— 国防部提出 “无限制军用” 要求

2026 年 1 月 9 日,美国国防部发布新版《国防部人工智能战略》,提出 “AI 优先” 作战力量;1 月 12 日,国防部长 Hegseth 公开放话:“责任 AI,意味着不能用那些不让你打仗的 AI 模型。”

核心要求:军用 AI 必须能在任何合法用途下使用,不受任何限制合法军事用途的政策约束 —— 本质是要求 Anthropic 彻底取消伦理限制,把 Claude 变成军方 “无禁区工具”。


三、摊牌时刻:2026 年 2 月 —— 最后通牒与正面交锋

2 月 5 日:Anthropic 发布 Claude Opus 4.6,同日其红队公开研究报告,称在开源软件中挖出 500+ 高危漏洞,其中不少是存在多年、专家未发现的老漏洞。•2 月 20 日:正式推出 Claude Code Security,主打代码漏洞扫描与自动补丁建议,直接冲击传统安全厂商,引发行业震动。•2 月 24 日:Hegseth 直接与 Anthropic CEO Amodei 闭门会晤,口头下达最后通牒:必须在 2 月 27 日 17:01(美东时间)前解除所有军用限制,否则将被列为 “供应链风险”,全面封杀。•2 月 26 日:Amodei 公开发文,正式拒绝军方要求:“当今 AI 可靠性不足以支撑完全自主武器。”•2 月 27 日:最后通牒到期,Anthropic 未妥协。特朗普随即在社交平台下令:所有联邦机构立即停用 Anthropic 技术;国防部同步发出供应链风险认定书,标签正式生效,要求所有与国防部合作的承包商(含微软、亚马逊、Palantir 等)证明其业务中未使用 Claude。


四、法律对抗与内部风波:2026 年 3 月

3 月 9 日:Anthropic 在旧金山联邦法院和华盛顿特区上诉法院分别提起诉讼,指控政府行为属于违宪报复。

3 月 26 日:两件事同日发生

•旧金山联邦法院法官 Rita Lin 批准初步禁令,认定政府封杀是 “典型的第一修正案报复”,非国防部联邦机构可恢复使用 Claude;•Anthropic CMS 配置失误,约 3000 份内部未发布文件(含 Mythos/Capybara 模型草稿)被公开访问,随后修复。Anthropic 确认原因为人为配置错误,与政府纠纷无关。

    •3 月 31 日:Claude Code CLI v2.1.88 发布时,误将完整 TypeScript 源码(约 51 万行、1906 个文件)打包进公开 npm 包,数小时内被研究者发现并广泛传播。Anthropic 确认为打包配置错误,非安全入侵,已发 DMCA 下架通知。

五、安全能力全面爆发:2026 年 4 月 —— Mythos 与银翼计划

4 月 7 日:Anthropic 发布 Mythos Preview,同步启动 Project Glasswing(银翼计划)。官方宣称 Mythos 已在主流操作系统、浏览器中挖出数千个 0day 漏洞,其中大量为严重高危漏洞。访问权限仅开放给 AWS、Apple、Google、Microsoft、Cisco、CrowdStrike 等 12 家核心合作方及约 40 家扩展机构,不对公众开放。这是 Anthropic 从 “通用 AI” 向 “AI 驱动安全” 战略升级的公开信号。•4 月 8 日:华盛顿特区联邦上诉法院做出相反裁决,驳回 Anthropic 暂停国防部封杀令的请求,维持 “供应链风险” 标签

至此,美国司法系统出现分裂判决:加州禁令 “松绑民用”,DC 上诉法院 “维持军用封杀”,双方进入长期法律拉锯。


六、最新进展:2026 年 4 月 18 日 —— 白宫与 Amodei 闭门会谈

据 Axios 独家报道,4 月 18 日,美国财政部长与白宫办公厅主任与 Anthropic CEO Amodei 举行闭门会谈,试图在 “封杀僵局” 与 “AI 安全红线” 之间寻找折中方案。谈判结果尚未公开。


这场博弈还没有结束。法庭上的拉锯仍在继续,白宫的闭门谈判尚无定论,而 Mythos 挖出的数千个 0day 还在等待修复。但有一件事已经清晰:Anthropic 用一场与全球最强政府的正面冲突,完成了一次最昂贵的价值声明。

从 2 亿美元合同到 “供应链风险” 标签,从 500+ 漏洞研究到 Mythos Preview 的受限发布,Anthropic 的每一步都在践行同一个逻辑:AI 能力越强,边界就越重要。 这不是软弱,而是一家真正理解自己在造什么的公司,才会有的清醒。

这场博弈的走向,短期内很难乐观。五角大楼不会轻易放弃对 AI 工具的完整控制权,Anthropic 也不太可能在核心红线上松口。更大的可能是:双方在法院判决的压力下,找到某种技术上可行、政治上可接受的折中 —— 但那两条红线本身,大概率会以某种形式保留下来,因为它们早已不只是一家公司的立场,而是整个行业正在形成的基准。

对我们这些安全从业者来说,这件事的意义不只是一桩商业纠纷。它提醒我们:AI 正在成为安全领域最核心的基础设施,而谁来定义它的边界,将直接决定它最终服务于谁。 Mythos 能在数周内挖出人类数十年未发现的漏洞,这种能力落在防御者手中是福,落在没有约束的地方则是另一回事。

所以,无需焦虑 AI 会不会取代安全工程师,我们应该先想清楚:我们希望这把剑握在谁手里,指向哪里。Anthropic 给出了它的答案,代价是实实在在的,我们这个行业,也该有自己的答案。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:凌霜雁安全志 fxe00 fxe00《【AI】Anthropic:在安全与强权之间,定义 AI 的边界》

评论:0   参与:  0