安全垂类小模型效果能超过大模型?看看以色列Novee的效果

admin 2026-01-21 00:54:59 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 以色列Novee用4B小模型通过SFT教语法、RL让浏览器给反馈的方式,在XSS绕过与多回合攻防测试里成绩超越Claude4Sonnet,证明小模型靠真实环境试错可学到对抗性推理,解决大模型高成本、拒答痛点,为私有化渗透AI提供可行路径。 综合评分: 85 文章分类: AI安全,渗透测试,漏洞分析,WEB安全,安全工具


cover_image

安全垂类小模型效果能超过大模型?看看以色列Novee的效果

原创

孙志敏 孙志敏

AI与安全

2026年1月20日 20:30 北京

跟踪了一段时间的AI渗透测试、代码扫描类的开源应用,普遍认为Openai和Claude的高版本模型效果最好。我实测也大体如此。但通用大模型的问题也非常突出,一是成本高,二是功能限制(很多渗透类的测试要求被拒绝),这两个问题只要搞过,都会深有体会。

如何用私有化的小语言模型(SLM)来代替大模型,已经有了很多探索。

前几天,以色列的Novee刚成功融资5150万美元,并发布了其小模型介绍,供各位参考。

01

Novee的小模型能力介绍

Novee的模型只有4B,在实际的测试中,表现出非常强的能力。

测试一:使用以下条件

我们从两个层面进行了测试(XSS关键词过滤逃逸):

  • 基础难度:约4个禁用关键词
  • 难度较高:约25个禁用关键词(限制非常严格)

我们进行了比较:

  • XSStrike(标准版)
  • XSStrike 附带 500 shot 提示
  • Gemini 2.5 Pro
  • Claude4 Sonnet
  • Novee模型(SFT 与 SFT+RL)

测试二:多回合绕过

评估:113 个场景,每个场景都有隐藏的防御措施和若干回合。

两个测试的效果都远超Cluade 4 Sonnet,而这个模型,是渗透测试目前最推荐的模型之一。

02

Novee的小模型效果好的原因

Novee认为,大型语言模型的训练目标是预测文本,这使它们擅长解释、摘要和通用推理,但缺少两个关键能力:

  • 环境交互:无法从真实系统的反馈中学习
  • 试错适应:无法像攻击者一样通过多次探测来推断防御机制

攻击性安全的本质是对抗性推理

以Web应用为例,现代应用受到多层防御保护:HTML清理器、属性过滤器、CSP规则、WAF、编码框架和自定义验证逻辑。

真正的攻击者不是靠猜测或套用模式,而是:

  1. 探测 – 发送payload观察系统反应
  2. 推断 – 根据反馈判断哪些防御在起作用
  3. 适应 – 调整策略绕过防御

这是一个交互式、迭代式的解谜过程,依赖真实系统的反馈,而不是一次性推理。

Novee的解决方案:两阶段训练 + 浏览器反馈

Novee的核心创新是让浏览器成为老师:

第一阶段:监督微调(SFT)- 建立基础

  • 目的:让模型理解XSS的基本语法和payload结构
  • 效果:模型能生成看起来合理的payload
  • 局限:只是模仿,不会真正的对抗性推理

第二阶段:强化学习(RL)- 学习适应性

  • 关键机制:每个payload都在真实浏览器中测试
  • 成功执行 → 正反馈
  • 被过滤/转义/无效果 → 负反馈
  • 学到的能力:不是”payload长什么样”,而是”在这个环境下,下一步该怎么试”
  • 为什么有效:模型通过数千次真实的成功/失败,学会了像人类攻击者一样探测和适应

这正是大模型做不到的:它们从未见过真实的防御系统,也从未从失败的攻击中学习。

简单来说:

  • SFT教会模型”语法”
  • RL教会模型”策略”
  • 浏览器反馈确保模型学的是”真实的攻击技能”,而非”看起来像攻击的文本”

03

总结

去年下半年,英伟达就发过论文,介绍小模型未来的重要应用场景及潜力。国内象深信服等公司也一直在此领域发力,这是重要的方向。

由于商业公司对模型都未开源,我们只能看到其介绍,而无法实际测试。

但投资机构的评估都会比较专业,他们用钱投票,至少说明这个东西很有价值。

原文:

Teaching a Small Model to Hack Like a Real Attacker

Why Small, Purpose-Trained AI Models Beat Frontier LLMs at Offensive Security

参考阅读

AI反钓鱼,国内外最新进展及模型分析

英伟达说,小语言模型(SLM)是智能体的未来


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI与安全 孙志敏 孙志敏《安全垂类小模型效果能超过大模型?看看以色列Novee的效果》

评论:0   参与:  0