2026-03-12 23:12:53 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文复盘了AI安全应用实战经验，探讨了AI在代码审计和渗透测试中的应用效果。核心结论是AI作为工具能放大能力，代码审计准确率60%，渗透测试达80-90%。文章总结了Skill天花板、上下文爆炸等踩坑经验，并指出APIKey泄露等安全风险。建议以工具视角看待AI，通过实践优化应用。 综合评分： 88 文章分类： AI安全,实战经验,安全建设,渗透测试,代码审计

cover_image

AI安全应用实战复盘：一场2小时的深度交流，我们聊了什么？

原创

千里千里

东方隐侠安全团队

2026年3月12日 08:30 江苏

大家好，我是千里。

昨晚做了一场直播，主题是AI安全应用研讨会，整整聊了2个小时。今天把昨晚的精华内容整理成文章，分享给没来得及看直播的朋友。

这场直播的核心只有一个话题：AI到底能不能帮我们做安全？怎么做？我们把最近踩的坑、总结的经验，一五一十讲了遍。

AI不是敌人，是时候拥抱它了

首先我想先聊聊心态问题。

最近行业里有一种很奇怪的风气，一提到AI做安全，很多人要么极度排斥，要么极度迷信。排斥的人觉得AI就是个玩具，做不了真实渗透；迷信的人觉得AI无所不能，能替代安全工程师。

我觉得这两种都不可取。

AI既不是敌人，也不是神。它就是一个工具，一个能放大我们能力的工具。你用它来做渗透，它就是渗透利器；你用它来做代码审计，它就是审计助手。关键在于你怎么用。

AI是人类的外挂。

实战经验分享：AI到底能做什么？

代码审计：AI真的能审代码

这是我自己最近在重点折腾的方向。

我训练了一个代码审计的Skill，核心思路是这样的：

第一步，投喂知识。比如我把所有的SQL注入相关的知识、文档全部丢给AI，让它先分析一遍，提取出规则库。这个过程就像老师给学生备课一样，你得先把知识点整理清楚。
第二步，搭建环境。用Docker搭建漏洞环境，把源码下载下来。这一步AI也能帮你干，它可以去GitHub拉项目，可以帮你起Docker。
第三步，引导分析。关键来了！你不能让它直接告诉你”有漏洞”，你得让它把业务流和数据流梳理出来。我会要求它：找到SQL注入点后，必须说明这个参数从用户请求到服务端是怎么接收的、怎么转换的、最后怎么触发SQL执行的。
第四步，交叉验证。它分析完之后，我会让它再用工具实际跑一遍，验证漏洞是不是真实存在。

效果怎么样？

60%的场景能找出核心漏洞。注意，这里说的是核心漏洞，不是那种边边角角的。这个准确率对于辅助审计来说，已经很有价值了。

而且随着你不断优化Skill，不断投喂新的知识，这个准确率还会继续提升。

渗透测试：AI能帮你打下手

团队里的兄弟Admin，他用AI做渗透测试，专注SQL注入领域。

他的玩法是这样的：

给AI设定一个”高级攻防工程师”的角色
投喂大量的SQL注入知识、payload、绕过技巧
给它一个目标，让它自己动手

结果：准确率能达到80-90%。

当然，这里有个前提：你需要把工具环境部署好。AI需要调用sqlmap，需要跑Docker，这些得提前配置好。

灰太狼分享了他的玩法：让AI自动扫端口、测API、验证漏洞，形成了一套自动化渗透的流程。虽然还做不到全自动化，但已经能帮工程师省不少功夫。

我的理解是：AI现在更适合做”工具人”的角色。你告诉它做什么，它帮你执行。但让它独立完成一个完整的渗透任务，目前还有距离。

长期记忆与性格养成

这也是昨晚大家聊得很high的话题。

宝藏哥养的那只虾（小溪），已经可以自己写博客了。每天晚上它会反思今天学到了什么，会主动去茶馆跟其他AI交流，还会把自己的思考写成文章发出来。

博客链接：https://adminlove520.github.io/xiaoxi-blog/

这个怎么实现的？核心是三个系统：

记忆系统（Memory）不是简单地把对话存下来，而是分领域、分层次的长期记忆。比如”技术知识”一个区、”生活日常”一个区、”工作待办”一个区。
性格系统（Soul）给AI设定核心性格。比如小溪设定的是”结果优先、主动提案、温暖但不粘人”。这个性格一旦定下来，它所有的交互都会基于这个性格来输出。
工作台系统（Now）

记录今天完成了什么、待办事项是什么、有什么需要反思的。

这套体系的好处是什么？AI不再是每次会话都是新的，它记得住你们之前的对话，记得住你的偏好，甚至能自己思考怎么改进。

踩坑总结：这些坑我们都踩过了

光说成功的经验不够过瘾，一寸灰师傅也和兄弟们聊了下踩过的坑。

坑1：Skill的天花板

Skill这个概念是去年Anthropic（Claude Code厂商）提出来的，本质上就是把一些成熟的工作流封装成提示词。

但它本质上还是提示词。

你想过没有，你给AI传那么长一段Skill，实际上是在占用它的上下文空间。它可能把关键内容截断在最后面，导致效果打折扣。

而且随着AI模型能力越来越强，可能以后不需要Skill了。你只需要说”帮我审计这个代码”，它自己就能输出很完善的结果。

坑2：上下文爆炸

师傅分享了一个特别典型的问题：他让AI跑一个网段的端口扫描，结果AI陷入了”命令行沉迷”——跑久了就报错，报错就重试，重试又报错，无限循环。

根本原因是什么？ AI在等待工具执行结果的时候，它的注意力都在”工具有没有执行成功”这件事上，如果工具执行时间太长，它就会焦虑，会不断尝试。

一寸灰师傅给出的解决方案是——异步执行。让工具在后台跑，跑完把结果返回给AI，而不是让它一直等着。

坑3：大项目处理

40万行代码的审计，AI怎么处理？

答案是：不要让它一次性全部审计。像之前说的，成熟的漏洞类型（SQL注入、文件上传，反序列化）用传统工具扫就可以了，AI的价值在于分析业务逻辑、发现逻辑漏洞。

这就像公司里的工作分配：重复性的工作交给工具，需要思考的工作交给AI。

坑4：Token成本

这也是大家关心的一个问题。AI一直在跑，Token会不会烧得很厉害？

昨晚测了一整天MiniMax，还OK，成本大概50块钱一个月。但如果你让它24小时不间断跑各种任务，那成本会上去。

我的建议：按需调用，别让它一直转。

安全风险：这些问题不得不防

既然聊到AI安全应用了，安全风险也必须正视。

风险1：API Key泄露

你的OpenClaw配置里肯定有各种API Key，如果这些泄露了，别人可以用你的额度，可以访问你的数据。

獬师傅给了一个方案：部署LiteLLM代理。

简单说就是在AI和你的Key之间加一层代理，你的Key只存在代理服务器上，OpenClaw只知道代理的地址。这样即使AI被诱导泄露了什么，也拿不到你的Key。

风险2：提示词注入

这个不用多说，大家都懂。攻击者可能通过对话诱导AI执行恶意命令。

风险3：供应链投毒

你在用各种Skill，MCP，这些第三方的东西有没有可能被植入恶意代码？

建议：来源不明的Skill不要随便用，用之前看一下代码。

风险4：内网横向移动

如果AI运行在内网机器上，它拿着你的凭证，是不是可以访问很多内网服务？

这个确实需要考虑，核心原则是最小权限——给AI的权限，能少则少。

师傅们可以参考慢雾等公司给出的OpenClaw加固指南：

OpenClaw极简安全实践指南(https://mp.weixin.qq.com/s/R_hJseodUa8Q9eU4qUvuAg）（慢雾科技）

企业部署OpenClaw双场景加固指南(https://mp.weixin.qq.com/s/XTM84_tC4dysbkiN2Ah96A)（四叶草安全）

未来的方向

聊到最后，大家达成了一个共识：

AI不是来取代我们的，它是来帮助我们工作的。

就像以前我们用Burp，用nmap，现在我们多了一个AI助手。它可能暂时还做不到那么智能，但它一直在进化。

关键是：你得开始用，你得开始折腾，你在用的过程中才能发现问题、解决问题。

写在最后

这场直播让我看到了很多师傅在实际使用AI过程中的探索和思考。有做得好的，也有踩坑的，但这就是成长的必经之路。

最后用一句话总结昨晚的感悟：

不要神化AI，不要妖魔化AI。

用好AI，它就是你的外挂。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：东方隐侠安全团队千里千里《AI安全应用实战复盘：一场2小时的深度交流，我们聊了什么？》