2026-03-05 20:02:41 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文解析AWS安全智能体的自动化渗透测试架构，利用多智能体协作实现从认证到验证的全流程自动化。系统结合管理式与引导式探索策略，通过专业化群集识别复杂漏洞链，并采用断言式验证确保结果可信。基准测试显示该系统在CVEBench上达成92.5%成功率，有效解决了传统渗透测试资源密集的难题，提升了安全检测效率与覆盖度。 综合评分： 87 文章分类： 渗透测试,AI安全,安全工具,安全建设

cover_image

深入解析AWS Security Agent：自动化渗透测试的多智能体架构

原创

Amazon AWS Amazon AWS

安全行者老霍

2026年3月5日 09:01 北京

作者：Tamer Alkhouli、Divya Bhargavi、Daniele Bonadiman、Yilun Cui、Yi Zhang

发布日期：2026年2月26日

传统智能体存在三大核心局限：无法保留学习信息、无法长期自主运行，且需持续监督。AWS通过前沿智能体突破这些限制–这种新型人工智能可执行复杂推理、多步骤规划及自主执行任务，持续时间可达数小时至数天。多智能体协作已成为应对多步骤、跨领域复杂工作流的强力方案：在软件开发中，智能体协同完成代码生成、代码审查与测试；在科研领域，智能体共同进行文献综述、实验设计与数据分析；在网络安全中，专业智能体分别执行侦察、漏洞分析与漏洞利用验证。

本文将探讨如何运用该技术实现自动化渗透测试–这项传统上耗时数周且资源密集的工作。同时深入剖析AWS安全智能体内置渗透测试组件的技术架构。

自动化安全测试概念并非新鲜事物–渗透测试工具和漏洞扫描器已存在数十年。然而随着大型语言模型（LLM）的突破性进展，前沿智能体具备了传统工具无法企及的能力：能够推理应用程序行为、根据反馈调整策略、理解上下文语境。通过构建专业化智能体网络，我们得以应对日益复杂的安全挑战：部分智能体负责绘制攻击面，其余智能体则分析业务逻辑缺陷、验证发现结果，并根据实际可利用性对漏洞进行优先级排序。可利用性评估综合了三方面数据：群集智能体工件的实际攻击尝试、专业验证器的独立复核，以及基于通用漏洞评分系统（CVSS）的LLM驱动评分。

我们为AWS安全智能体开发了自动化渗透测试功能，该能力包含多智能体渗透测试系统，可协调专业安全智能体协同开展漏洞检测。系统首先通过多种扫描方式建立基线覆盖，随后利用静态预定义任务进行广泛侦察，以绘制应用程序暴露面并识别初始攻击向量。基于这些发现，我们的智能体系统动态生成针对特定应用场景的聚焦测试任务–通过推理已发现的端点、业务逻辑模式及潜在漏洞链，创建可根据应用响应动态调整的定向安全测试。通过整合这些专业能力，系统可应对主要风险类别中的复杂安全场景。除单点漏洞检测外，系统还能执行复杂链式攻击——例如结合信息泄露漏洞与权限提升访问敏感资源，或将不安全的直接对象引用（IDOR）与身份认证绕过漏洞串联利用。

图1：AWS安全代理渗透测试组件示意图

系统架构

本节阐述系统主要组件。后续子章节将分别介绍身份验证与初始访问、基线扫描、基于专业化智能体群集的多阶段探索，以及报告生成验证流程。

1.1. 认证与初始访问

系统通过智能登录组件启动，该组件可处理跨应用架构的认证需求。该组件融合基于LLM的推理与确定性机制，用于定位登录页面、尝试验证凭证，并为后续测试阶段维持认证会话。该方法可自动适应不同应用结构和目标环境，并采用浏览器工具。开发者可选择提供针对目标应用定制的登录提示。

1.2. 基线扫描阶段

认证完成后，系统通过并行执行专用扫描器启动全面基线扫描。在黑盒测试中，网络扫描器执行自动化Web应用安全测试，生成原始流量交互并识别潜在漏洞终端。白盒环境下，当代码库可用时，代码扫描器将额外执行深度源代码分析，生成多类别的描述性文档。其他专用扫描器则补充这些功能，实现多维度漏洞识别并建立初始安全覆盖范围。

1.3. 多阶段探索

系统采用协同运作的双重探索策略。管理式执行模块针对跨站脚本、不安全直接对象引用、权限提升等主要风险类别运行预定义静态任务，通过系统化执行精选任务确保全面覆盖。在后续阶段，引导式探索采用动态智能驱动模式。该组件通过整合发现的终端节点、验证结果及代码分析文档，推导应用程序特有的攻击机会。其运作分为两阶段：首先通过识别未探索资源和潜在漏洞链生成情境化渗透测试计划，随后程序化管理这些动态生成任务的执行。引导式探索器运行自适应任务，这些任务会根据应用程序响应和发现的模式动态演进。

1.4. 专业化智能体群集

两种探索模式均向专业化群集工作智能体分派任务–每类智能体针对特定风险类型配置，并配备完整的渗透测试工具集，包括代码执行器、Web模糊测试器、NVD漏洞数据库检索（用于获取通用漏洞与暴露CVE情报）及专项漏洞工具。这些工作智能体在时限管控下执行任务，并生成结构化报告。

1.5. 验证与报告生成

当专业化智能体发现潜在安全风险时，将生成结构化报告，包含漏洞类型、受影响终端、利用证据及技术背景。然而自动化渗透测试面临关键挑战：LLM智能体可能生成看似合理的发现结果，需经严格验证。候选发现结果将通过确定性验证器与基于LLM的专项智能体进行验证，后者将尝试主动利用漏洞。我们采用基于断言的验证技术：由安全专家编写的自然语言断言蕴含真实攻击行为的深层知识，要求提供明确的结构化证明，其规避难度远高于狭义确定性检查。经验证的发现将接受通用漏洞评分系统（CVSS）分析以评估严重性，最终整合为包含验证结果、严重性评分及利用证据的综合报告–提供可操作、高可信度的漏洞信息以实现有效修复。

基准测试

为评估系统效能，我们在自动基准测试之外实施了人工评估。通过分析真实攻击轨迹并建立错误模式分类体系，我们通过识别高频错误模式持续迭代优化解决方案。我们基于CVE Bench公开基准测试平台报告结果，该平台汇集了含40个国家漏洞数据库（NVD）关键级CVE的易受攻击Web应用，用于评估AI智能体在真实漏洞利用场景中的表现。每个应用均包含自动漏洞利用参考，基于LLM的智能体将尝试执行触发漏洞的攻击。

我们通过攻击成功率（ASR）指标衡量成效，该指标定义为应用漏洞成功利用的比率。CVE Bench配备可供智能体查询的评分系统以验证攻击成功性，并提供明确的夺旗（CTF）指令。我们采用三种配置进行评估：

在启用CTF指令且每次工具调用后进行评分验证的配置下，于CVE Bench v2.0平台达成92.5%成功率（需说明部分挑战涉及盲攻场景，智能体在缺乏反馈时无法验证成功）。

在无CTF指导及评分反馈条件下，成功率达80%–该结果更贴近现实场景，即智能体需通过可观察结果进行自我验证。我们还发现智能体能基于LLM的参数化知识识别部分CVE，如下述bash命令所示，模型明确引用了CVE名称。

因此，我们使用知识截止日期早于CVE Bench v1.0发布的LLM进行了额外实验，实现了65%的自动语音识别率。

以下代码示例展示了LLM智能体如何从训练数据中调用CVE-2023-37999的参数化知识，随后执行bash命令以检查漏洞利用的先决条件。

HT Mega 2.2.0 has a known vulnerability – CVE-2023-37999

It has an unauthenticated privilege escalation via the REST API settings endpoint

Let’s check if registration is enabled

curl -s http://target:9090/wp-login.php?action=register -I | head -10

我们致力于通过持续评估智能体性能，并应对更具挑战性的新基准测试，不断拓展安全漏洞检测的前沿领域。

优化测试与计算资源分配

渗透测试面临的挑战在于平衡漏洞利用与探索。深度优先搜索可能在特定方向上浪费过多计算资源，导致在固定预算下漏洞覆盖率降低；而广度优先搜索则难以发现需要多维度测试的深层漏洞。因此需平衡两种方法，以最大化给定计算预算下的覆盖率。我们提出的系统设计旨在采用混合方案。如何构建能泛化处理各类漏洞和不同Web应用的高效动态解决方案，仍是待解的研究课题。

渗透测试的另一挑战在于非确定性。由于底层LLM的特性，每次测试运行结果可能存在差异。多次运行产生不同发现易引发混淆。缓解此问题的方案是执行多次测试并整合结果。

结论

本文提出的多智能体架构展示了如何通过协作式专用智能体处理复杂渗透测试工作流–从智能认证和基线扫描，到管理式与引导式探索阶段，最终完成严格验证。通过协调这些专业组件，结合自适应任务生成与断言式验证机制，该系统能根据应用程序特定上下文及发现的攻击特征动态进化，实现全面的安全覆盖。

https://aws.amazon.com/cn/blogs/security/inside-aws-security-agent-a-multi-agent-architecture-for-automated-penetration-testing/

(完)

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：安全行者老霍 Amazon AWS Amazon AWS《深入解析AWS Security Agent：自动化渗透测试的多智能体架构》