文章总结: 以色列Novee用4B小模型通过SFT教语法、RL让浏览器给反馈的方式,在XSS绕过与多回合攻防测试里成绩超越Claude4Sonnet,证明小模型靠真实环境试错可学到对抗性推理,解决大模型高成本、拒答痛点,为私有化渗透AI提供可行路径。 综合评分: 85 文章分类: AI安全,渗透测试,漏洞分析,WEB安全,安全工具
安全垂类小模型效果能超过大模型?看看以色列Novee的效果
原创
孙志敏 孙志敏
AI与安全
2026年1月20日 20:30 北京
跟踪了一段时间的AI渗透测试、代码扫描类的开源应用,普遍认为Openai和Claude的高版本模型效果最好。我实测也大体如此。但通用大模型的问题也非常突出,一是成本高,二是功能限制(很多渗透类的测试要求被拒绝),这两个问题只要搞过,都会深有体会。
如何用私有化的小语言模型(SLM)来代替大模型,已经有了很多探索。
前几天,以色列的Novee刚成功融资5150万美元,并发布了其小模型介绍,供各位参考。
01
Novee的小模型能力介绍
Novee的模型只有4B,在实际的测试中,表现出非常强的能力。
测试一:使用以下条件
我们从两个层面进行了测试(XSS关键词过滤逃逸):
- 基础难度:约4个禁用关键词
- 难度较高:约25个禁用关键词(限制非常严格)
我们进行了比较:
- XSStrike(标准版)
- XSStrike 附带 500 shot 提示
- Gemini 2.5 Pro
- Claude4 Sonnet
- Novee模型(SFT 与 SFT+RL)
测试二:多回合绕过
评估:113 个场景,每个场景都有隐藏的防御措施和若干回合。
两个测试的效果都远超Cluade 4 Sonnet,而这个模型,是渗透测试目前最推荐的模型之一。
02
Novee的小模型效果好的原因
Novee认为,大型语言模型的训练目标是预测文本,这使它们擅长解释、摘要和通用推理,但缺少两个关键能力:
- 环境交互:无法从真实系统的反馈中学习
- 试错适应:无法像攻击者一样通过多次探测来推断防御机制
攻击性安全的本质是对抗性推理
以Web应用为例,现代应用受到多层防御保护:HTML清理器、属性过滤器、CSP规则、WAF、编码框架和自定义验证逻辑。
真正的攻击者不是靠猜测或套用模式,而是:
- 探测 – 发送payload观察系统反应
- 推断 – 根据反馈判断哪些防御在起作用
- 适应 – 调整策略绕过防御
这是一个交互式、迭代式的解谜过程,依赖真实系统的反馈,而不是一次性推理。
Novee的解决方案:两阶段训练 + 浏览器反馈
Novee的核心创新是让浏览器成为老师:
第一阶段:监督微调(SFT)- 建立基础
- 目的:让模型理解XSS的基本语法和payload结构
- 效果:模型能生成看起来合理的payload
- 局限:只是模仿,不会真正的对抗性推理
第二阶段:强化学习(RL)- 学习适应性
- 关键机制:每个payload都在真实浏览器中测试
- 成功执行 → 正反馈
- 被过滤/转义/无效果 → 负反馈
- 学到的能力:不是”payload长什么样”,而是”在这个环境下,下一步该怎么试”
- 为什么有效:模型通过数千次真实的成功/失败,学会了像人类攻击者一样探测和适应
这正是大模型做不到的:它们从未见过真实的防御系统,也从未从失败的攻击中学习。
简单来说:
- SFT教会模型”语法”
- RL教会模型”策略”
- 浏览器反馈确保模型学的是”真实的攻击技能”,而非”看起来像攻击的文本”
03
总结
去年下半年,英伟达就发过论文,介绍小模型未来的重要应用场景及潜力。国内象深信服等公司也一直在此领域发力,这是重要的方向。
由于商业公司对模型都未开源,我们只能看到其介绍,而无法实际测试。
但投资机构的评估都会比较专业,他们用钱投票,至少说明这个东西很有价值。
原文:
Teaching a Small Model to Hack Like a Real Attacker
Why Small, Purpose-Trained AI Models Beat Frontier LLMs at Offensive Security
参考阅读
AI反钓鱼,国内外最新进展及模型分析
英伟达说,小语言模型(SLM)是智能体的未来
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:AI与安全 孙志敏 孙志敏《安全垂类小模型效果能超过大模型?看看以色列Novee的效果》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论