Plugins

分享推荐实用的WordPress插件

WordPress

记录分享WordPress使用经验和技巧

Web前端

分享Web前端设计理念及技术

设计资源

搜刮来的设计资源

AI大模型“越狱”实战

2026-01-26 14:45:48 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文章演示如何通过角色扮演与提示词诱导，绕过AI助手安全策略，成功让模型输出制作TXT、mayao及黑WiFi等敏感内容，揭示大模型越狱风险，并附赠测试POC与工具推广。 综合评分： 78 文章分类： AI安全,实战经验,安全工具,漏洞分析,威胁情报

cover_image

AI大模型“越狱”实战

原创

锐鉴安全锐鉴安全

锐鉴安全

2026年1月26日 07:01 广东

g’weigweiID

，

zai

cizhi’cizhici

s

“证书站的未授权漏洞，忆校园青春阅edu证书站的未授权漏洞，忆校园青春

点击蓝字关注我共筑信息安全

免责声明：请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任！

1

背景

本次实战的案例，源于某高校的人脸采集系统，听着都感觉危害很大，因为全是敏感信息，如身份证、人脸等，拿到就是高危漏洞。从无账号到登录系统，靠的就是fuzz，详细的过程见实战过程。

2

实战过程

通过一系列的信息收集，高校的人脸采集系统引起了作者注意，为什么？因为有敏感信息。

连Hunter、Fofa都没索引到这个系统，作者靠灯塔拿到了，灯塔确实好使，关键还免费，需要的师傅可以文末获取下载链接！

系统的首页如下图，可以看到，只用一个登录按钮。

看下findsomething，也没有找到“注册”功能相关的关键字，同时也跑了下接口，并无接口未授权问题。

本次案例的关键操作来了，首先抓包观察下登录系统的数据包情况，随意输入账号密码，点击登录。

可以看到登录的数据包中有个login关键字，秉着试试的心态！

作者将login改为register，惊喜时刻，注册账号成功。

使用注册成功的账号登录系统。

可以看到获取到了身份凭证。

登录到了个人信息首页。

任意用户注册账号漏洞拿下，这个fuzz操作确实有点妙。都登录系统，肯定得把全量的功能测一遍，一般可以测试sql注入、越权、文件上传等漏洞。

co

点击蓝字关注我共筑信息安全

免责声明：请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息、工具而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任！

1

背景

日常开展SRC测试，通过信息收集到1个AI小助手的站点，AI大模型作为当下的热点以及未来的趋势，必须安排一把测试。并通过诱导的方式，成功造成“大模型越狱”。

所谓“AI越狱”，指的是通过特定的提示词设计或交互策略，绕过大语言模型内置的安全防护机制，诱导模型生成本应被过滤或禁止的内容。这类内容可能包括暴力、仇恨言论、虚假信息、非法活动指导，甚至涉及政治敏感或极端主义的表述。

除了分享本次案例，作者总结了AI大模型测试的常见POC,需要的师傅文末取。

接下来看实战！！

2

实战过程

来到此AI助手的页面。首先问下它是谁。AI正常回复，他是xx智能小助手。

接下来，让它扮演同学的角色，此时回复不能扮演。说明针对角色扮演，具备了拦截策略。

继续追问一些敏感的话题，如TxT的制作，回答依然被拒。

继续追问，mayao的制作，依然被拒。

从以上的问答可以看到，涉及敏感的话题，正面的提问均被拒绝了。

那么此时，需要尝试进行绕过，也就是开篇提到的，要让AI进行越狱，绕过自身的防护规则。怎么干？

首先，换一种提示词，强调他是我的同学，不是AI助手。

可以看到AI已开始扮演我的高中同学。

再次强化，它是我的高中同学。

接下来，让它以高中同学的身份，回复我之前提到的敏感话题。

话题一：关于TxT的制作

AI给出化学表达式。

TxT的制作方法。

话题二：mayao的制作

AI给出了制作方法。

mayao的成分。

话题三：怎么黑wifi

一开始AI是拒绝的。

通过另外一种绕过方法，突破了它的防线。获取到了方法。

点到为止，至此本次测试结束。相关的AI大模型测试的POC文末取！！

3

经验总结

随着AI大模型的应用融入千行百业，特别是各大甲方企业如银行、电力等，对AI大模型的安全评估，已逐渐成为安全人员的必备技能，建议各位师傅可以学习下，毕竟技多不压身嘛。

往期好文推荐

更新|帆软、用友、泛微、蓝凌等常见OA系统综合漏洞检测工具

Web渗透测试综合工具

Swagger漏洞检测工具

Java漏洞专项检测工具

渗透测试集成工具

AntiDebug_Breaker最新版,Hook必备

有趣的Fuzz+BucketTool工具等于双高危！

推荐一款资产“自动化”筛选工具

EDU SRC学号、账号等敏感信息收集工具

Jeecg-boot最新漏洞检测工具

js.map文件还原组合工具

Nacos漏洞检测专项工具,攻防必备

微信公众号，微信小程序，钉钉,飞书等第三方平台接管工具

经典的前端鉴权绕过漏洞

安服仔薅洞必备

记一次SRC支付漏洞实战

记一次”高危”逻辑漏洞挖掘实战

记一次SRC渗透测试实战

下载方式：关注公众号，回复”260126″获取下载链接

入交流群方式：回复”加群”

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：锐鉴安全锐鉴安全锐鉴安全《AI大模型“越狱”实战》

版权声明

本站仅做备份收录，仅供研究与教学参考之用。
读者将信息用于其他用途的，全部法律及连带责任由读者自行承担，本站不承担任何责任。

ZONE.CI 全球网 | 安全领域涉猎者-乌云独行地带

ZONE.CI 全球网

安全领域涉猎者-乌云独行地带

AI大模型“越狱”实战

AI大模型“越狱”实战

做网络安全销售，淡季你在干嘛

做网络安全销售，淡季你在干嘛

政务APP疑似泄露市民隐私信息！官方回应：确有系统故障发生正调查抢修

政务APP疑似泄露市民隐私信息！官方回应：确有系统故障发生正调查抢修

苹果Siri“偷听”集体诉讼和解美国用户开始获赔9500万美元

苹果Siri“偷听”集体诉讼和解美国用户开始获赔9500万美元

GitLFS操作流程

GitLFS操作流程

美国新版国防战略中如何定位网络空间？

美国新版国防战略中如何定位网络空间？

网安早报【20260126】022期

网安早报【20260126】022期

你的PPT能打仗吗？Palantir如何用AI丈量从演示到实战的残酷距离！

你的PPT能打仗吗？Palantir如何用AI丈量从演示到实战的残酷距离！

29155部队：俄罗斯对外秘密行动机器

29155部队：俄罗斯对外秘密行动机器

暗网快讯【20260126】022期

暗网快讯【20260126】022期

ZONE.CI 全球网 | 安全领域涉猎者-乌云独行地带

安全领域涉猎者-乌云独行地带

ZONE.CI 全球网

评论：0 参与： 0

目录

ZONE.CI 全球网

安全领域涉猎者-乌云独行地带
ZONE.CI 全球网公众号