2026-01-21 00:54:59 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 以色列Novee用4B小模型通过SFT教语法、RL让浏览器给反馈的方式，在XSS绕过与多回合攻防测试里成绩超越Claude4Sonnet，证明小模型靠真实环境试错可学到对抗性推理，解决大模型高成本、拒答痛点，为私有化渗透AI提供可行路径。 综合评分： 85 文章分类： AI安全,渗透测试,漏洞分析,WEB安全,安全工具

cover_image

安全垂类小模型效果能超过大模型？看看以色列Novee的效果

原创

孙志敏孙志敏

AI与安全

2026年1月20日 20:30 北京

跟踪了一段时间的AI渗透测试、代码扫描类的开源应用，普遍认为Openai和Claude的高版本模型效果最好。我实测也大体如此。但通用大模型的问题也非常突出，一是成本高，二是功能限制（很多渗透类的测试要求被拒绝），这两个问题只要搞过，都会深有体会。

如何用私有化的小语言模型(SLM)来代替大模型，已经有了很多探索。

前几天，以色列的Novee刚成功融资5150万美元，并发布了其小模型介绍，供各位参考。

Novee的小模型能力介绍

Novee的模型只有4B,在实际的测试中，表现出非常强的能力。

测试一：使用以下条件

我们从两个层面进行了测试（XSS关键词过滤逃逸）：

基础难度：约4个禁用关键词
难度较高：约25个禁用关键词（限制非常严格）

我们进行了比较：

XSStrike（标准版）
XSStrike 附带 500 shot 提示
Gemini 2.5 Pro
Claude4 Sonnet
Novee模型（SFT 与 SFT+RL）

测试二：多回合绕过

评估：113 个场景，每个场景都有隐藏的防御措施和若干回合。

两个测试的效果都远超Cluade 4 Sonnet,而这个模型，是渗透测试目前最推荐的模型之一。

Novee的小模型效果好的原因

Novee认为，大型语言模型的训练目标是预测文本，这使它们擅长解释、摘要和通用推理，但缺少两个关键能力：

环境交互：无法从真实系统的反馈中学习
试错适应：无法像攻击者一样通过多次探测来推断防御机制

攻击性安全的本质是对抗性推理

以Web应用为例，现代应用受到多层防御保护：HTML清理器、属性过滤器、CSP规则、WAF、编码框架和自定义验证逻辑。

真正的攻击者不是靠猜测或套用模式，而是：

探测 – 发送payload观察系统反应
推断 – 根据反馈判断哪些防御在起作用
适应 – 调整策略绕过防御

这是一个交互式、迭代式的解谜过程，依赖真实系统的反馈，而不是一次性推理。

Novee的解决方案：两阶段训练 + 浏览器反馈

Novee的核心创新是让浏览器成为老师：

第一阶段：监督微调（SFT）- 建立基础

目的：让模型理解XSS的基本语法和payload结构
效果：模型能生成看起来合理的payload
局限：只是模仿，不会真正的对抗性推理

第二阶段：强化学习（RL）- 学习适应性

关键机制：每个payload都在真实浏览器中测试
成功执行 → 正反馈
被过滤/转义/无效果 → 负反馈
学到的能力：不是”payload长什么样”，而是”在这个环境下，下一步该怎么试”
为什么有效：模型通过数千次真实的成功/失败，学会了像人类攻击者一样探测和适应

这正是大模型做不到的：它们从未见过真实的防御系统，也从未从失败的攻击中学习。

简单来说：

SFT教会模型”语法”
RL教会模型”策略”
浏览器反馈确保模型学的是”真实的攻击技能”，而非”看起来像攻击的文本”

总结

去年下半年，英伟达就发过论文，介绍小模型未来的重要应用场景及潜力。国内象深信服等公司也一直在此领域发力，这是重要的方向。

由于商业公司对模型都未开源，我们只能看到其介绍，而无法实际测试。

但投资机构的评估都会比较专业，他们用钱投票，至少说明这个东西很有价值。

原文：

Teaching a Small Model to Hack Like a Real Attacker

Why Small, Purpose-Trained AI Models Beat Frontier LLMs at Offensive Security

参考阅读

AI反钓鱼，国内外最新进展及模型分析

英伟达说，小语言模型（SLM)是智能体的未来

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI与安全孙志敏孙志敏《安全垂类小模型效果能超过大模型？看看以色列Novee的效果》