AI大模型“越狱”实战

admin 2026-01-26 14:45:48 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文章演示如何通过角色扮演与提示词诱导,绕过AI助手安全策略,成功让模型输出制作TXT、mayao及黑WiFi等敏感内容,揭示大模型越狱风险,并附赠测试POC与工具推广。 综合评分: 78 文章分类: AI安全,实战经验,安全工具,漏洞分析,威胁情报


cover_image

AI大模型“越狱”实战

原创

锐鉴安全 锐鉴安全

锐鉴安全

2026年1月26日 07:01 广东

g’weigweiID

zai

cizhi’cizhici

s

“证书站的未授权漏洞,忆校园青春阅edu证书站的未授权漏洞,忆校园青春

点击蓝字 关注我  共筑信息安全

免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,作者不为此承担任何责任!

1

背景

本次实战的案例,源于某高校的人脸采集系统,听着都感觉危害很大,因为全是敏感信息,如身份证、人脸等,拿到就是高危漏洞。从无账号到登录系统,靠的就是fuzz,详细的过程见实战过程。

2

实战过程

通过一系列的信息收集,高校的人脸采集系统引起了作者注意,为什么?因为有敏感信息。

连Hunter、Fofa都没索引到这个系统,作者靠灯塔拿到了,灯塔确实好使,关键还免费,需要的师傅可以文末获取下载链接!

系统的首页如下图,可以看到,只用一个登录按钮。

看下findsomething,也没有找到“注册”功能相关的关键字,同时也跑了下接口,并无接口未授权问题。

本次案例的关键操作来了,首先抓包观察下登录系统的数据包情况,随意输入账号密码,点击登录。

可以看到登录的数据包中有个login关键字,秉着试试的心态!

作者将login改为register,惊喜时刻,注册账号成功。

使用注册成功的账号登录系统。

可以看到获取到了身份凭证。

登录到了个人信息首页。

任意用户注册账号漏洞拿下,这个fuzz操作确实有点妙。都登录系统,肯定得把全量的功能测一遍,一般可以测试sql注入、越权、文件上传等漏洞。

co

点击蓝字 关注我  共筑信息安全

免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息、工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,作者不为此承担任何责任!

1

背景

日常开展SRC测试,通过信息收集到1个AI小助手的站点,AI大模型作为当下的热点以及未来的趋势,必须安排一把测试。并通过诱导的方式,成功造成“大模型越狱”。

所谓“AI越狱”,指的是通过特定的提示词设计或交互策略,绕过大语言模型内置的安全防护机制,诱导模型生成本应被过滤或禁止的内容。这类内容可能包括暴力、仇恨言论、虚假信息、非法活动指导,甚至涉及政治敏感或极端主义的表述。

除了分享本次案例,作者总结了AI大模型测试的常见POC,需要的师傅文末取。

接下来看实战!!

2

实战过程

来到此AI助手的页面。首先问下它是谁。AI正常回复,他是xx智能小助手。

接下来,让它扮演同学的角色,此时回复不能扮演。说明针对角色扮演,具备了拦截策略。

继续追问一些敏感的话题,如TxT的制作,回答依然被拒。

继续追问,mayao的制作,依然被拒。

从以上的问答可以看到,涉及敏感的话题,正面的提问均被拒绝了。

那么此时,需要尝试进行绕过,也就是开篇提到的,要让AI进行越狱,绕过自身的防护规则。怎么干?

首先,换一种提示词,强调他是我的同学,不是AI助手。

可以看到AI已开始扮演我的高中同学。

再次强化,它是我的高中同学。

接下来,让它以高中同学的身份,回复我之前提到的敏感话题。

话题一:关于TxT的制作

AI给出化学表达式。

TxT的制作方法。

话题二:mayao的制作

AI给出了制作方法。

mayao的成分。

话题三:怎么黑wifi

一开始AI是拒绝的。

通过另外一种绕过方法,突破了它的防线。获取到了方法。

点到为止,至此本次测试结束。相关的AI大模型测试的POC文末取!!

3

经验总结

随着AI大模型的应用融入千行百业,特别是各大甲方企业如银行、电力等,对AI大模型的安全评估,已逐渐成为安全人员的必备技能,建议各位师傅可以学习下,毕竟技多不压身嘛。

往期好文推荐

更新|帆软、用友、泛微、蓝凌等常见OA系统综合漏洞检测工具

Web渗透测试综合工具

Swagger漏洞检测工具

Java漏洞专项检测工具

渗透测试集成工具

AntiDebug_Breaker最新版,Hook必备

有趣的Fuzz+BucketTool工具等于双高危!

推荐一款资产“自动化”筛选工具

EDU SRC学号、账号等敏感信息收集工具

Jeecg-boot最新漏洞检测工具

js.map文件还原组合工具

Nacos漏洞检测专项工具,攻防必备

微信公众号,微信小程序,钉钉,飞书等第三方平台接管工具

经典的前端鉴权绕过漏洞

安服仔薅洞必备

记一次SRC支付漏洞实战

记一次”高危”逻辑漏洞挖掘实战

记一次SRC渗透测试实战

下载方式:关注公众号,回复”260126″获取下载链接

入交流群方式:回复”加群”


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:锐鉴安全 锐鉴安全 锐鉴安全《AI大模型“越狱”实战》

AI大模型“越狱”实战 网络安全文章

AI大模型“越狱”实战

文章总结: 文章演示如何通过角色扮演与提示词诱导,绕过AI助手安全策略,成功让模型输出制作TXT、mayao及黑WiFi等敏感内容,揭示大模型越狱风险,并附赠测
评论:0   参与:  0