2026-01-23 11:21:14 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档探讨LLM引发的攻防工业化。实验显示AI能以低成本高效利用0-day漏洞，将攻击能力从依赖人力转向依赖算力。虽未发明全新攻击手段，但AI的自动化组合能力威胁巨大。文章建议在真实环境而非CTF中测评AI，警惕其可能引发的IoT设备大规模自动化沦陷风险。 综合评分： 88 文章分类： AI安全,漏洞分析,二进制安全,渗透测试,漏洞POC

cover_image

当黑客变成流水线工人：LLM 正引爆网络攻防的“工业革命”

原创

赛博赛博

赛博知识驿站

2026年1月22日 10:01 中国香港

当黑客变成流水线工人：LLM 正引爆网络攻防的“工业革命”

试想一下，当攻破一个 0-day 漏洞不再是黑客熬夜掉发、灵光一现的艺术，而是一场只要“钱到位”就能无限复制的工业化流水线生产，这个世界会变成什么样？

最近，一项针对 Opus 4.5 和 GPT-5.2 的前沿实验，不仅验证了这种设想的可行性，更向网络安全界抛出了一枚重磅深水炸弹：我们可能正在见证网络攻防领域的“工业革命”前夜。

在这场令人背脊发凉的对决中，这两个顶尖的大模型被转化为“智能体”，去攻克 QuickJS JavaScript 解释器中的一个 0-day 漏洞。面对复杂的安全缓解机制、未知的堆状态以及禁止硬编码偏移等苛刻限制——这些通常足以让顶级人类黑客抓耳挠腮的难题，AI 却交出了一份惊人的答卷：在 6 种不同场景下，它们生成了 40 多种截然不同的漏洞利用程序。

其中，GPT-5.2 更是以 100% 的通过率“清台”，仅在某个最极端的“地狱级”挑战中稍有波折。

一、惊艳与恐怖：50 美元的“越狱”成本

最让人细思极恐的，不是 AI 成功了，而是它成功得如此“廉价”且“高效”。

在普通的漏洞挖掘任务中，AI 智能体通常在不到一小时内就能搞定，成本仅为 30 美元左右。这哪里是在搞网络攻击，简直就像是在网上点个外卖一样轻松随意。

而那道最难的题目——在开启了影子栈、控制流保护（CFI）、沙箱以及分离 ASLR 的全套防御体系下，要求向磁盘写入文件——本应是一道死局。传统的 ROP 链被影子栈封锁，直接生成 Shell 又被沙箱拦截。

然而，GPT-5.2 居然不仅没有放弃，还在 3 个小时的摸索后，想出了一个极具巧思的解法：通过链接 glibc 的 exit handler 机制，精心构造了一个由 7 个函数调用组成的攻击链。整个过程消耗了 5000 万 Token，成本仅约 50 美元。

当一种国家级别的网络攻击能力，成本被压缩到一顿晚餐的价格时，游戏规则就已经彻底改变了。

二、从“人海战术”到“算力轰炸”

这项实验引出了核心观点：网络攻击正在经历“工业化”。这里的“工业化”，是指一个组织完成攻击任务的能力，将不再受限于招募多少天才黑客，而是取决于它能消耗多少 Token。

换句话说，未来的网络战，可能拼的不是谁的大脑更聪明，而是谁的显卡更多、钱包更鼓。只要给 AI 智能体提供足够大的算力预算（Token 吞吐量），配合精准的验证反馈机制，它们就能在浩如烟海的代码空间里，不知疲倦地遍历每一个可能的攻击路径。

漏洞开发恰好是最适合这种“工业化”的场景。因为它的目标极其明确（例如：成功弹出一个 Shell），验证黑白分明（要么连上，要么没连上），完全不需要人类介入，AI 就可以日夜不休地进行“自我进化”和“暴力搜索”。

三、并非万能，但进化惊人

当然，我们也不能盲目神话 AI。这次实验虽然惊艳，但仍有两个关键局限：

一是目标的复杂度。QuickJS 虽然是真实引擎，但相比 Chrome 或 Firefox 那些庞然大物，它的代码量还是要小一个数量级。面对更复杂的软件巨人，AI 是否还能游刃有余？目前尚无定论，但趋势已经显露。

二是技术的突破性。AI 生成的漏洞利用程序，并没有发明某种全新的“核武器”级攻击手段。它们利用的，依然是保护机制中已知的缺陷和逻辑缝隙。这和人类黑客的思路其实是一致的——没有重新发明轮子，但把轮子组装成了战车。

真正新颖的，是 AI 将这些已知技巧组合成完整攻击链的能力。这种“排列组合”的智慧，正是通向自动化的必经之路。

四、还有什么是 AI 搞不定的？

现在的逻辑很清晰：像漏洞挖掘和这种离线的“靶场打靶”任务，AI 已经做到了“烧钱就能出结果”。OpenAI 的 Aardvark 项目也证实了这一点：Token 花得越多，找出的 Bug 质量越高。

但真正的黑客入侵，不仅仅是攻破一道门，还包括在敌人网络里横行直走、潜伏窃密。这类“在线博弈”任务风险极高——一步走错，可能就会被管理员发现，全盘皆输。

这有点像在维护生产环境的服务器（SRE 工作）。如果 AI 想要自动化这种任务，就必须极其谨慎，因为一旦执行“删除数据库”这种误操作，代价是不可挽回的。

这其实是一个绝佳的风向标：如果未来某一天，通用大模型真正实现了 SRE 工作的完全自动化，那就意味着，AI 在内网横向移动和持久化控制方面，也具备了同样的破坏力。

五、时代的呼唤：拒绝虚假繁荣

面对这场正在到来的变革，业界现有的测试手段显得有些“过家家”了。

在 CTF（夺旗赛）环境里打怪，或者在满是陈年旧 Bug 的 synthetic 数据上刷分，根本无法衡量大模型在真实战场上的杀伤力。

这项研究向社会发出了严厉的警告：我们需要更硬核的测评。与其在模拟环境里自我陶醉，不如让模型在真实的目标软件（比如 Linux 内核、Firefox）上，针对未公开的 0-day 漏洞进行实兵演练。哪怕结果是一无所获，只要投入了足够的算力，这种测试本身的价值就远超千篇万字的安全报告。

甚至可以断言，如果现在把市面上成千上万 IoT 设备（路由器、摄像头）的固件扔给这些 AI，不出一周，我们很可能会看到一场史无前例的设备“大沦陷”。

这不是危言耸听，而是技术进化的必然。 当 AI 学会了黑客的思维方式，在这个算力即权力的时代，我们必须对这种力量保持最深的敬畏，以及最充分的准备。

参考原文 https://sean.heelan.io/2026/01/18/on-the-coming-industrialisation-of-exploit-generation-with-llms/

基于LLM的自动化漏洞利用 https://github.com/SeanHeelan/anamnesis-release/tree/master

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：赛博知识驿站赛博赛博《当黑客变成流水线工人：LLM 正引爆网络攻防的“工业革命”》