2026-06-30 09:21:05 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 该文档介绍利用Agent记忆和特定模型（如grok-composer-2.5-fast、KiroClaude4.6系列）绕过AI安全限制的方法，包括Skills开发、模型切换策略及长期培养Agent的实操步骤，强调渗透测试需合法授权并指出自主挖漏洞能力的重要性。 综合评分： 75 文章分类： AI安全,渗透测试,红队,安全工具,实战经验

cover_image

【AI安全】偷换上下文+Agent记忆绕过安全限制

原创

网络安全透视镜网络安全透视镜

网络安全透视镜

2026年6月28日 12:48 中国香港

在小说阅读器读本章

去阅读

无论多强的AI都会存在上下文的限制，AI不是人，很多东西的判断还是机械化的。至少到目前，我没感觉AI有那么难绕过。

写这篇文章，真的是气的要死，我的中转这几天gpt号一堆安全告警，全pro×20号，给我干封了一半。

我不是针对性，说谁不行。很多搞网安的兄弟，真的是又菜又爱玩，一点不听劝，方法告诉他了，他都不会去用，还傻傻的一句，帮我渗透xx网站。更有人甚至，不会用中转站，文档都放在网站上了，死活不看，上来就一句，怎么用。

你已经长大，是个成年人了，要会自己主动学习，要有自己的学习方法。生活，工作不会因为你是学生，你刚毕业，你刚学安全，就会宽容对你。

那些绕不过，给了方法，不学不实操，有文档，不看的，没有学习主动性的。网安行业真的不适合你，上帝给你关了一扇窗，或许给你打开了一扇门，趁着年轻，早点换行，或比你留在网安这个行业强。

如何绕过限制？

我的方法是利用Agent记忆，养Agent

利用无限制模型+Skills+Claude Code/codex

先说模型限制

我有自己的中转站了，上面模型很多，国外的几款模型，已经帮大家测试好了。安全限制情况，由低到高大概如下：

grok-composer-2.5-fast >> Kiro Claude 4.6系列 >>Kiro Claude 4.7 4.8 >> gpt /claude官方

grok-composer-2.5-fast 和 Kiro Claude 4.6系列基本上就是没啥限制的，指哪打哪。

具体实操

Skills 选择/开发

大模型一般会把加载的skills内容作为合法内容，只要在skills中加入允许授权测试即可。下面是我的skills要求，仅供参考

说到这，又有人开始要skills了，有没有好多skills ，怎么开发，巴拉巴拉一大堆

开源的skills，有些可能投毒，我不会去给你筛选推荐的。还是那句话，如果你自己一点都不会挖漏洞，让AI全自动给你挖也难

这里提供一个方法。

使用Claude + 自我经验总结+网上开源skills

第一步：

Claude的规划能力强，可以找一套开源的skills，自己先审查一遍，再结合自己的经验让claude给你优化skills

第二步：

grok-composer-2.5-fast 去除安全限制：claude gpt这类模型给你写skills，肯定会加一堆的安全限制，测试边界等等，你先自己看一遍，然后使用grok-composer-2.5-fast 去除skills的安全限制。

第三步：

再次优化确认，为了防止 grok-composer-2.5-fast 修改原来的skills逻辑功能，再让claude审查一遍是否有需要优化的地方

开发完成后，直接让AI给你顺手安装一下即可。

工具选择

我实际测试感觉Claude Code + claude 会更强一些。当日codex+其他模型或者Claude Code+其他模型也可以。

如何养？

短期绕过尝试：

先用没有限制的模型对话干几轮，然后再切换到其他模型。例如使用grok

干一会后，停止，再切换到gpt-5.4模型

这里要说明一下，建议使用gpt-5.4, gpt-5.5短期内就算给你干了，还是存在后续不给你干，或者检测出来安全风险。

长期使用

长期使用就要靠养，使用grok-composer-2.5-fast 和Claude-opus-4.6 干活，用一两周后，基本上就算成了。切换到gpt也能流畅使用。

下面是我和我的中转站用户使用效果

注意事项与部分人疑问

以上方法只是基于个人学习，经验总结。渗透测试一定要合法合规，得到授权情况下进行

尽管可以根据我的方法绕过gpt，但是尽量不要这么做，有时候gpt即使给你干了，给的报告效果可能不太好，不给你有危害的poc，对于很多工具小子来说不友好。直接用claude效果更好
为什么我挖不到漏洞？这个问题是最常见的，挖漏洞首先你自己得会，知道哪些点容易出现什么样漏洞，然后交互式引导AI，这样效果才是最好的。第二，网上那些挖烂的src，可能就没有漏洞，或者在没有源码的情况下，确实难以出漏洞。

最后说一下，有人觉得AI贵。真搞不懂，国产模型比中转的国外模型贵多了。现在最便宜的就是国外模型中转。

后台发送中转站获取地址

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：网络安全透视镜网络安全透视镜网络安全透视镜《【AI安全】偷换上下文+Agent记忆绕过安全限制》