文章总结: 本文探讨了基于多智能体协同的主动安全实战化体系,指出传统被动防御难以应对AI驱动的动态攻击。文章提出以平行智能理论为基础,通过感知、分析、决策、执行、反思五类智能体协同,结合生成式对抗、联邦学习等技术构建自主进化防御体系。实测数据显示该体系在多模态防护和金融场景中显著提升威胁检出率并降低误报,建议政企机构转向能力驱动、体系协同的实战化安全建设。 综合评分: 85 文章分类: AI安全,安全建设,解决方案,技术标准,安全运营
专题·智能体安全 | 基于多智能体协同的主动安全实战化体系
原创
江乃慈 林永悦 江乃慈 林永悦
中国信息安全
2026年6月30日 18:04 北京
在小说阅读器读本章
去阅读
江乃慈
文 | 福建省网络与信息安全测评中心 江乃慈 林永悦
生成式人工智能与多智能体技术加速普及,正在从底层重塑网络空间的攻防格局。当前,智能化技术被大量用于构建自动化、智能化攻击链路,攻击者可借助人工智能快速生成钓鱼内容、构造恶意代码、挖掘并利用系统漏洞,自主规划攻击路径,攻击技术门槛显著降低,攻防失衡程度持续加剧。而以特征匹配、事后补救为核心的传统被动防御模式,在面对无固定特征、动态迭代的人工智能驱动新型攻击时,检测失效、响应迟缓等缺陷集中暴露,已难以满足智能化时代的网络安全防护需求。
在此背景下,政企机构的安全建设普遍面临两大核心痛点:一是能力黑盒,安全防护设备大规模部署,但防护效能难以量化评估,安全资金投入难以转化为可落地、可验证的实战防御能力;二是响应滞后,威胁研判、处置、溯源全流程高度依赖人工干预,处置耗时通常达到小时级乃至天级,难以匹配人工智能攻击高速迭代的节奏。同时,攻防资源不对等、安全工具碎片化、跨域数据壁垒等共性问题长期存在,致使传统被动防御体系逐步触及效能天花板。为此,亟须构建以实战效果为导向、以主动对抗为核心、以智能协同为支撑的主动安全实战化防御体系。
一、AI智能体的双重挑战与安全治理目标
AI智能体技术在网络安全领域呈现鲜明的双向作用,既为防御能力升级带来重要机遇,也显著放大了威胁面与风险强度,这一现实正是构建主动安全体系的核心背景与逻辑起点。
(一)机遇与挑战并存的双重图景
在防御赋能层面,AI智能体为威胁检测、安全事件响应、安全运营优化等关键环节提供高效能支撑。依托大模型的自然语言理解、逻辑推理与泛化归纳能力,智能体可从海量网络日志与安全告警中快速甄别异常行为模式,显著提升对未知隐蔽威胁的识别研判效率。根据2024年IT市场研究和咨询公司IDC《中国安全大模型实测之安全运营》实测数据,融合大模型能力的智能检测架构可将Web流量综合威胁检出率提升至98%,关键安全信息提取耗时缩短80%。然而,上述检测识别能力在工程化部署中仍面临对抗鲁棒性不足、跨域数据合规约束及复杂威胁场景仿真等关键挑战。
在威胁加剧层面,AI与多智能体技术被攻击者广泛滥用,催生多条规模化、低成本攻击路径,主要包括自动化钓鱼文本与深度伪造内容生成、恶意代码批量变种与免杀构造、漏洞快速挖掘与自动化利用、攻击链路自主规划与协同执行等。与此同时,多智能体系统与关键信息基础设施深度融合后,带来自主决策边界模糊、责任归属失效、风险跨域快速扩散、系统级连锁故障等新型安全风险,治理难度显著提升。
(二)主动安全治理框架的必要性
基于上述局限影响,传统被动防御范式已难以适配智能体时代的对抗环境。面向AI与多智能体时代,安全治理必须实现三大根本性转向:一是从被动防御转向主动布防,以攻验防、以对抗强能力,将防御关口前移,提前暴露并修复短板;二是从合规驱动转向能力驱动,以可量化、可验证、可持续进化的实战防护效果为核心目标;三是从工具堆叠转向体系协同,打通数据、决策、行动全链路,构建闭环化、一体化、自主化的防御体系。以上三大转向共同确立了主动安全实战化体系的治理目标与建设方向。
二、多智能体协同防御的理论与实践
多智能体协同是主动安全体系的核心组织形式,也是实现自主防御、破解信息孤岛的关键支撑。
(一)理论框架
主动安全体系以平行智能ACP理论为核心基础,通过人工系统(A)、计算实验(C)、平行执行(P)三位一体的架构,实现物理安全空间与人工安全空间的双向交互、实时映射、对抗推演与策略引导,构建可描述、可预测、可引导的动态防御机制。物理空间通过资产测绘、流量采集、日志归一化完成状态抽象与数字孪生建模,将真实网络环境转化为可计算、可推演的虚拟模型;人工空间构建高逼真仿真环境,支撑无风险攻防演练与策略迭代优化;计算实验提供对抗推演与效果量化能力;平行执行实现最优策略实时下发与防御动作闭环,最终形成虚实共生、持续进化的防御体系。
在架构层面,系统按功能划分为五类相互协作的专业化智能体。其中,感知类智能体负责网络流量、系统日志、资产状态与外部威胁情报的统一采集、清洗及归一化处理,构建全域统一的数据底座;分析类智能体基于多源数据开展关联分析、攻击溯源、意图识别与风险等级评定,形成高质量研判结果;决策类智能体依据风险态势与防御目标,生成标准化、可执行、可追溯的处置策略与行动方案;执行类智能体根据决策指令完成自动化封禁、隔离、阻断、流量牵引、漏洞修复与告警推送等处置操作;反思类智能体则在安全事件闭环后,开展根因分析、策略评估、模型优化与经验沉淀,推动体系持续迭代进化。
五类智能体通过统一通信协议、协同调度机制与分层冲突消解规则实现高效协同:按威胁等级、业务影响与处置时效设定任务优先级,由全局协调器完成资源调度与指令仲裁,解决任务冲突、资源竞争与决策死锁问题,确保多智能体协同有序、决策一致。该架构从底层打通传统安全工具之间的数据链路与行动通道,使防御体系具备自主感知、自主分析、自主决策、自主执行、自主进化的综合能力。值得强调的是,自主化并不排斥人工介入,对于高敏感度或高不确定性的安全事件,体系保留人机增强接口,由智能体完成数据预处理与方案推荐后,交由安全专家最终研判,从而在效率与风险可控性之间取得平衡。
(二)实践成效
在多模态系统安全防护场景中,依托以上五类智能体协同联动机制,可对模型越狱、恶意提示注入、越权指令调用等对抗性攻击实施全链路管控。中国信息安全测评中心《人工智能安全风险测评(2025)》公开实测数据显示,测试环境为覆盖文本、图像、语音的多模态大模型服务接口,基于大规模对抗性提示样本集,涵盖越狱攻击、提示注入、越权调用等主流对抗手段,以传统单一内容审核引擎为基线进行对比测试。结果显示,传统防护引擎对恶意诱导攻击拦截成功率仅为61.4%,多智能体协同防御架构的拦截成功率提升至93.7%,对抗性攻击渗透成功率下降32.3%;通过多智能体交叉研判过滤无效告警,模型安全监测的误报率由11.8%降至2.6%;依托反思智能体迭代优化风控规则,模型异常响应频次减少40.5%,有效解决了多模态系统风控滞后、恶意样本识别不全、误告警偏高等行业共性问题。
在金融行业实战化安全评估场景中,该架构结合生成式对抗模拟攻击能力,可完成流量监测、威胁研判、自动阻断、风险复盘全流程作业。依据中国银行业协会《金融科技安全发展报告(2024)》实测数据,测试环境为金融典型业务架构,覆盖10类主流攻击场景,连续观测30天,基线为传统规则型防护体系。结果显示,传统防御体系隐蔽攻击检出率不足38%,平均事件处置时长超过115分钟;部署多智能体协同架构后,异常流量与隐蔽攻击检出率提升至89.2%,高危事件处置时长压缩至17分钟,安全告警综合误报率下降72.4%,可精准识别传统设备难以捕获的慢速渗透、伪装访问等隐蔽威胁。
三、支撑多智能体协同的核心使能技术
多智能体协同体系以三类核心使能技术作为底层支撑,这些技能与体系中的五类智能体架构形成了明确的“技术—功能”映射关系。其中,生成式对抗安全技术主要服务于分析、决策与反思三类智能体:为分析智能体提供对抗样本以优化检测模型,为决策智能体模拟攻击路径以验证策略有效性,为反思智能体生成多样化攻击变体以支撑根因分析与经验沉淀。联邦学习与隐私保护技术主要支撑感知智能体的跨域数据协同,在不泄露原始数据的前提下,实现多源威胁情报的联合建模与知识共享。大规模威胁场景生成技术则为五类智能体体系提供标准化的训练与验证环境,支撑感知、分析、决策、执行、反思全链路的闭环迭代优化。
(一)生成式对抗安全技术
生成式对抗安全技术为多智能体体系提供主动对抗与策略优化能力,主要服务于分析、决策、反思智能体。该技术通过在体系内部构建攻防博弈环境,模拟多样化攻击场景,持续淬炼检测规则与处置策略,实现以攻验防、以对抗强能力的目标。该技术可用于对抗样本防御、自动化红队演练、攻击模拟等场景,帮助防御方提前发现脆弱点、完善防护策略。
需要说明的是,这一类比在教学层面具有有效性,但生成对抗网络(GAN)在训练中存在模式崩溃与训练不稳定的固有问题。在网络安全对抗场景中,这一问题意味着“判别器”(防御方)可能陷入对特定攻击变体的过拟合,即仅能有效识别训练过程中见过的攻击形态,而对分布外的变种攻击识别能力骤降,甚至出现漏报。这一缺陷与主动安全体系追求的“全面覆盖、动态适应”目标存在内在张力。本体系通过引入多样化攻击生成策略与周期性模型重置机制加以缓解,但理论上无法完全消除此类风险,因此,在实际部署中需辅以人工抽检与外部红队测试作为补充验证手段。
在工程应用中,需客观界定该技术的能力边界。生成式对抗模型的生成空间本质上受训练数据分布约束,其生成的样本为已知攻击模式的变体与扩展,而非真正意义上的“未知威胁”。更准确的表述是:该技术能够生成多样化的攻击变体,帮助防御体系应对已知威胁的变种及其衍生形态,从而在动态对抗中保持安全能力的相对领先。
(二)联邦学习与隐私保护技术
该技术支撑多智能体体系实现跨域数据协同,解决跨机构威胁情报共享中的数据安全与合规难题。联邦学习实现“数据不动模型动”,在不泄露原始数据、不突破合规边界的前提下,支持多方联合建模与协同训练,为跨域智能体协同提供可行路径。在此基础上,可结合同态加密、差分隐私、可信执行环境(TEE)等技术,进一步强化计算过程与数据传输的安全性。
需要指出的是,同态加密、差分隐私与可信执行环境(TEE)三类技术的叠加使用会带来显著的计算开销。在网络安全威胁情报的实时共享场景中,系统对延迟的容忍度极低(通常要求毫秒级响应),这一性能与安全之间的张力是工程实践中重要的落地障碍。例如,在跨机构联合威胁狩猎场景中,全栈隐私保护可能导致情报共享延迟从毫秒级攀升至秒级,直接影响检测的时效性。本体系在工程实践中采用分级策略以应对这一障碍:对延迟敏感的核心检测环节优先使用轻量级差分隐私,对离线训练或非实时协同场景启用全栈隐私保护,从而在安全性与运行效率之间寻求可接受的平衡。
(三)大规模威胁场景生成技术
该技术为多智能体体系提供标准化训练与验该技术为多智能体体系提供标准化的训练与验证环境,基于大模型与网络仿真能力,自动生成高逼真、可量化的对抗场景,支撑防御能力检验与体系迭代优化。通过约束性场景生成、动态难度调整、闭环评估优化三大机制保障训练效果。
其中,动态难度调整机制的设计目标是使演练强度始终适配防御方能力水平。然而,实现这一目标面临一个前置性技术难题:系统需要能够准确评估防御方的当前能力状态,包括威胁检出率、处置时效、策略正确性等多维指标的综合量化,而这本身在学术界和工业界均尚无成熟统一的解决方案。本体系通过复盘历史演练数据中的威胁检出率与处置耗时,构建能力评估代理模型,实现演练难度的分档调整。但该方法的评估精细度与泛化能力仍有较大提升空间,在复杂业务场景下的工程可靠性尚需进一步验证。该技术可大幅降低实战演练成本,提升演练频次,推动多智能体防御体系在常态化对抗中持续强化。
四、结 语
随着生成式AI与多智能体技术持续演进,网络安全治理将从单一技术治理逐步走向全域生态治理。基于多智能体协同的主动安全实战化体系,以平行智能为理论根基,以五类专业化智能体为执行主体,以生成式对抗、联邦学习、大规模场景生成为支撑技术,构建自主感知、自主分析、自主决策、自主执行、自主进化的闭环防御能力,可有效破解智能体时代攻防失衡、能力黑盒、响应滞后等核心痛点。未来,防御体系将向自进化、跨域协同、人机增强、可解释安全方向深度发展,治理模式也将更加注重多方参与、规则明确、责任清晰、技术可控、安全可托。通过构建体系化、实战化、智能化、生态化的主动安全治理框架,能够有效应对智能体时代的新型安全风险,推动AI安全与网络安全同步发展、同步治理、同步提升,让安全能力真正成为高质量数字化转型的可靠底座与坚实保障。
(本文刊登于《中国信息安全》杂志2026年第5期)
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:中国信息安全 江乃慈 林永悦 江乃慈 林永悦《专题·智能体安全 | 基于多智能体协同的主动安全实战化体系》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。






![[EDU]某学院旁站测试(一)](/images/random/titlepic/11.jpg)





评论