2026-07-02 06:11:28 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文探讨AI在漏洞挖掘领域的应用现状与发展趋势，指出随着CVE漏洞数量持续攀升，AI已从早期概念验证演进为覆盖攻击面识别、双线审计、动态验证的工程化体系。文章分析模型能力涌现与智能体工程两条技术路线，并详细拆解全局侦察、双线审计、验证报告三大核心工作流，强调当前AI主要作为人类研究员的效率放大器，通过人机协同模式实现漏洞挖掘的规模化与精准化。 综合评分： 95 文章分类： 漏洞分析,安全工具,ai安全,安全开发,web安全

cover_image

别卷了，让AI去挖洞吧！

原创

牛叫瘦牛叫瘦

HACK之道

2026年6月30日 09:23 重庆

在小说阅读器读本章

去阅读

一、漏洞增长与AI的入场

软件漏洞的披露速度正在逼近一个令人不安的临界点。CVE漏洞披露数从2020年开始持续攀升，2024年突破4万，2025年逼近5万。与此同时，C/C++代码库中大约70%的安全漏洞与内存安全有关。漏洞发现的速度已经远远超出了传统人工审计与单点工具的处理能力。

这一现实倒逼安全行业寻找新的方法论。过去两年间，业界对“AI能否挖掘漏洞”经历了从质疑、观望到探索，再到逐步落地实践的完整过程。随着大模型在推理能力、长上下文窗口、代码理解与工具调用等方面的持续迭代，智能化漏洞挖掘已从早期“依靠大模型阅读片段代码”的浅层探索，演进为全流程自动化漏洞挖掘体系的技术探索与闭环验证。

但一个基本事实必须澄清：AI目前无法独立取代安全研究员。正如Fluid Attacks在其AI SAST实践中明确指出的，AI SAST是混合安全工作流的一部分，而非对人类研究员的替代。AI的价值在于放大而非取代人类的能力。

二、两条技术路线

当前AI漏洞挖掘领域正在形成两条并行发展的技术路线。

第一条是模型能力涌现路线，以基础大模型为中心，依托模型的代码理解、推理和泛化能力发现候选漏洞。这条路线的优势在于通用性强、覆盖面广。典型的代表如OpenAI的Codex智能体，其工作流从Git仓库出发，依次经历威胁建模、漏洞发现、沙盒验证、修复、人工复审到提交Pull Request。

第二条是智能体工程实战路线，以安全智能体为中心，强调把安全专家经验、漏洞知识库、真实攻防数据和自动化验证流程沉淀进智能体，在真实系统中形成可持续运行的工程化能力。这条路线场景更深、贴近真实攻防、流程闭环更完整。

两条路线并非简单的优劣之争。真正的分水岭在于：AI漏洞挖掘正在从模型能力展示，进入真实系统、真实生态、真实攻击链中的工程化验证阶段。

三、AI自动漏洞挖掘工作流的典型架构

一套成熟的AI漏洞挖掘流水线，需要复刻安全专家的完整工作思路，覆盖攻击面识别、漏洞初筛、可利用性研判、漏洞动态验证、报告生成等关键环节。运行流程可以拆解为三大核心阶段。

第一阶段：全局侦察收集

代码审计最容易陷入“只见树木，不见森林”的困境。跨组件调用、微服务交互极易形成分析盲区。一个程序可能有数千个函数、上百条路由、十几个权限层级，如果让模型直接扎进函数细节，无异于盲人摸象。

全局侦察阶段的核心是让AI看清目标的“整张地图”——依托大模型的长上下文承载与代码语义理解能力，将完整程序工程载入上下文窗口，打破单文件、单模块的分析局限。这一阶段需要完成攻击面的系统梳理，识别出所有可能的入口点、数据流路径和权限边界。

Fluid Attacks的AI SAST扫描器在这一阶段的实践值得参考：首先解析代码仓库，将代码划分为函数级别的单元——输入在哪里被接收、值在哪里被转换、查询在哪里被构建、模板在哪里被渲染、授权检查在哪里被执行。随后通过专有机器学习模型对每个函数进行评估，产生候选漏洞声明而非直接判定漏洞。这种“候选生成器”的思路将搜索空间从整个代码库大幅缩小到可管理的候选集合。

第二阶段：双线审计分析

侦察完成后，进入审计分析阶段。这一阶段通常采用双线并行的策略：静态分析线和动态分析线。

静态分析线方面，传统SAST工具面临的核心痛点是误报率过高——超过80%的SAST结果可能是误报。Red Hat与NVIDIA合作的SastAI项目给出了一个工程化的解法：采用智能体多阶段研究工作流，通过RAG和语义代码搜索，自主分析源代码、CWE数据和现有安全报告。其背后的模式挖掘工作流设计尤为精妙——利用约8000个人工标注的发现（涵盖200多个包）作为训练数据，通过三层分层采样机制（包粒度、包大小和误报率、问题类型多样性）防止数据泄露和模型过拟合。

动态分析线则更多与模糊测试结合。FuzzingBrain V2提出了一种“可疑点（Suspicious Point, SP）”的抽象概念——用控制流地标而非行号去描述可疑代码区域，既能精准定位又能让LLM配合fuzzer完成复现。系统采用SP Fuzzer与Global Fuzzer的双层模糊测试策略，在资源受限场景下兼顾覆盖率和深度。在AIxCC 2025决赛C/C++数据集上，这一系统达到了36/40（90%）的检测率。

第三阶段：攻击路径验证与报告生成

发现候选漏洞只是开始，验证才是真正的分水岭。

一个AI生成的漏洞报告，在提交给开源维护者之前，必须回答一系列硬问题：报告的攻击路径是否可达？输入是否受攻击者控制？是否存在有效的消毒、转义、验证或授权机制？影响是否可复现并清晰解释？

这正是当前许多AI漏洞挖掘方案的短板——“AI报漏洞但不可验证”是长期困扰行业的核心痛点。FuzzingBrain V2的工程价值恰恰在于，它把“发现-定位-复现-报告”的完整链路全部自动化，所有确认的漏洞都通过OSS-Fuzz现成的模糊测试器和sanitizer实现100%可复现。在真实部署中，该系统在19个开源项目中发现了41个零日漏洞，其中26个被维护者确认、23个已修复。

报告生成阶段同样不可忽视。AI需要产出结构化的审计报告，包含漏洞描述、影响范围、复现步骤和修复建议。OpenAI的Codex智能体甚至能够在验证通过后自动生成修复代码并提交Pull Request。

四、工程化实践

模型幻觉是AI漏洞挖掘中最棘手的问题之一。直接使用大模型进行代码审计，普遍存在覆盖度不足、模型幻觉突出、分析逻辑碎片化、误报居高不下等问题。解决思路是将漏洞挖掘全流程拆解为若干职责清晰、任务独立的智能体角色，通过工作流统一编排，完成任务拆解、链路联动、动态提示词生成、工具自主调用及策略自适应调整。

工具生态的整合同样关键。基于大模型驱动的自动化漏洞挖掘系统往往需要融合LLM、蒙特卡洛树搜索（MCTS）和模型上下文协议（MCP），通过MCP实现Nmap、SQLmap等现有安全工具的自动化调用与结果验证。FuzzingBrain V2也通过MCP协议将静态分析与动态分析工具同时暴露给智能体使用。

从实验到工程是另一道门槛。360发布的AI安全报告指出，AI安全已过了“秀能力”的阶段。其漏洞挖掘智能体“图龙锋”已累计挖掘3432个漏洞，其中监管确认105个，覆盖开源代码、操作系统、办公软件、AI智能体平台等多个场景。这组数字的意义不在于数量本身，而在于它证明了AI漏洞挖掘可以在真实系统中形成可持续运行的工程化能力。

AI自动漏洞挖掘不会取代安全研究员，但它正在深刻改变安全研究的工作方式。就像自动化测试没有取代测试工程师一样，AI漏洞挖掘工具的价值在于把研究员从重复性的、低价值的劳动中解放出来，让他们把精力集中在真正需要人类判断力的地方——理解业务逻辑、评估实际风险、设计防御策略。

未来的AI漏洞挖掘工作流，大概率不是“全自动无人介入”的黑盒，而是“人机协同、持续迭代”的灰盒——AI负责广度覆盖和初步筛选，人类负责深度研判和最终决策。这种分工，也许才是AI与安全结合的最优解。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：HACK之道牛叫瘦牛叫瘦《别卷了，让AI去挖洞吧！》