2026-04-28 06:33:29 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文系统梳理2025年七大顶会150余篇Agent安全领域论文，涵盖越狱防御、红队测试、多Agent博弈等关键方向。核心发现包括：双Agent迭代可提升越狱效率，沙盒接口限制能有效约束Agent行为，过程奖励模型优化Web自动化训练。可操作建议涉及将AgentFuzz集成至CI/CD流程、多Agent互审机制用于内容审核、RAG技术增强应用可靠性。 综合评分： 85 文章分类： AI安全,红队,安全工具,漏洞分析,安全运营

cover_image

7大顶会、150篇论文，2025 Agent 安全领域最全调研

原创

i3eg1nner&林00 i3eg1nner&林00

SecureNexusLab

2026年4月18日 10:06 北京

在小说阅读器读本章

去阅读

「整理：丸一口 | 2026.04」

❝

一开始整理这个材料的时候，只想着小范围传播，所以会有一些“锐评”和“idea废案”。没想到被SecureNexusLab的小伙伴邀请做广泛开源，内容比较多，没精力对这些碎碎念做删减了，希望不会影响到大家的阅读。

❞

📌

本文覆盖2025年 「S&P / USENIX / CCS / NDSS / ICLR / NeurIPS / ACL」 七大顶会，「150+篇」Agent安全相关论文，每篇带「思路总结」。

🔗

「GitHub」： 👉 https://github.com/Van-Echo/OpenWanYikou/tree/main/06-Survey
「原博主B站主页」： 👉 https://space.bilibili.com/3461572290677609
「评论/获取PDF」：关注公众号后台发送“智能体安全”，获取完整版（含完整PDF及所有论文）

一、S&P 2025

二、USENIX 2025

三、CCS 2025

四、NDSS 2025

五、ICLR 2025（含Poster）

六、NeurIPS 2025

七、ACL 2025（精选）

💡 几个“废案”想法（可能对你有启发）

「Agent越狱的“疫苗”思路」：能不能让Agent提前见过所有越狱模板，就像打疫苗一样？—— 成本太高，放弃了
「用验证码反制Agent」：既然Agent能过验证码，那能不能动态生成Agent过不了的验证码？—— 猫鼠游戏，没想清楚边界
「多Agent“相互水论文”」：让多个Agent互相review + 改稿，自动产出文献综述 —— 试过，质量太差，但未来可期

如果对你有帮助，欢迎「转发、在看、分享」给更多朋友。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：SecureNexusLab i3eg1nner&林00 i3eg1nner&林00《7大顶会、150篇论文，2025 Agent 安全领域最全调研》