文章总结: 扬州大学团队在顶刊TIFS发表SSLDefender研究,提出基于蒸馏引导遗忘学习的自监督后门防御方案。该方法通过触发还原与知识蒸馏,有效移除预训练编码器后门。实验显示其将攻击成功率降至约2%且保持精度,性能优于SOTA,解决了模型后门修复难题。 综合评分: 85 文章分类: AI安全,漏洞分析,解决方案
扬州大学信息工程学院(人工智能学院)软件与安全团队一项成果在网络与信息安全顶刊TIFS发表
信息网络安全杂志
2026年1月25日 17:01 上海
近日,扬州大学信息工程学院(人工智能学院)软件与安全团队2023级硕士生朱万全等人在网络与信息安全顶级期刊《IEEE Transactions on Information Forensics and Security》发表了题为“SSLDefender: Backdoor Defense in Self-Supervised Learning via Distillation-guided Unlearning”的研究论文。
自监督学习能够利用大量未标注数据训练编码器,学习到高质量的数据表示,有力推动了计算机视觉等领域的发展。然而,研究表明自监督学习同样面临多种安全与隐私威胁,其中后门攻击尤为突出——攻击者可在预训练阶段植入后门,使得下游分类器继承该恶意行为,严重影响模型安全性。目前,后门防御方法多集中于监督学习场景,严重依赖标注信息,难以直接迁移至自监督学习范式。此外,针对自监督学习的现有防御策略多局限于在训练阶段识别并剔除污染数据,对于已经嵌入后门的预训练编码器,尚缺乏有效的修复机制。为此,我们提出SSLDefender,这是自监督学习中一种基于图像的新颖的后门缓解方法,可以直接在后门编码器上有效地去除后门属性。具体来说,首先,我们采用了基于互信息最大化的触发还原方法,更快速有效地获得与目标后门影响力相似的触发器。其次,我们设计了蒸馏引导遗忘学习的策略,在有效遗忘后门特征的同时,保证干净知识的保留,以防过度遗忘。对六个基准数据集的广泛实验评估表明,无论是否迁移到下游数据集,SSLDefender都能成功地将Badencoder的ASR降到2%左右,同时保证模型在主任务上的精度,性能远高于SOTA方法。
《IEEE Transactions on Information Forensics and Security》是公认的网络与信息安全领域的顶级期刊,也是中国计算机学会推荐的A类期刊。
来源:扬州大学信息工程学院(人工智能学院)
信息网络安全
《信息网络安全》创刊于2001年,是由公安部主管,公安部第三研究所、中国计算机学会主办,面向国内外公开发行的国内首批信息安全类期刊之一,于2015年成为中国科技核心期刊,2017年成为中国科学引文数据库来源期刊,2018年成为中文核心期刊,2022年入选CCF计算领域高质量科技期刊分级目录。
中文核心期刊
中国科技核心期刊
中国科学引文数据库来源期刊
CCF计算领域高质量科技期刊
我们在不断努力和完善中,期待您的关注和支持!
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:信息网络安全杂志 《扬州大学信息工程学院(人工智能学院)软件与安全团队一项成果在网络与信息安全顶刊TIFS发表》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论