四川大学人工智能安全领域最新研究成果被ICLR2026接收

admin 2026-03-03 05:55:06 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 四川大学网络空间安全学院研究成果被ICLR2026接收,提出一种针对预训练编码器的零牺牲持续鲁棒性对抗防御框架。该框架通过多分支结构与置信度决策,仅需一次微调即可实现跨任务统一防御,实验显示正常样本准确率最高提升29.20%,对抗准确率最高提升73.05%。此成果首次由本科生一作发表于机器学习顶会,彰显了该校在AI安全领域的科研与育人成效。 综合评分: 85 文章分类: AI安全,解决方案,安全大事件


cover_image

四川大学人工智能安全领域最新研究成果被ICLR 2026接收

信息网络安全杂志

2026年2月25日 18:42 上海

近日,四川大学网络空间安全学院在人工智能安全领域取得重要突破,研究成果《Zero-Sacrifice Persistent-Robustness Adversarial Defense for Pre-Trained Encoders》被国际机器学习领域国际顶级会议International Conference on Learning Representations 2026(ICLR 2026)接收。论文第一作者为四川大学网络空间安全学院2022级本科生雷竺鑫,通讯作者为杨子元博士和张意教授。

ICLR与ICML、NeurIPS并称为机器学习领域三大国际顶级会议,是该领域最具影响力和前沿性的学术平台,享有极高的学术声誉。此次论文被ICLR接收,标志着我院在模型安全与对抗鲁棒性研究方向上取得的成果获得国际同行的高度认可。

该研究聚焦于预训练编码器在下游任务中面临的“下游无关对抗样本”安全问题。针对现有防御方法需针对不同任务反复微调、且易牺牲模型正常性能的局限,论文创新性地提出了一种零性能牺牲、具备跨任务持续鲁棒性的对抗防御新框架。该方法通过多分支结构与置信度决策机制,仅需一次对抗微调即可实现对多种下游任务的统一高效防御,在保持乃至提升正常样本性能的同时,显著增强了模型对抗攻击的鲁棒性。大量实验结果表明,该方法在多个自监督预训练模型与数据集上均表现优异,在部分实验中正常样本准确率最高提升29.20%,对抗准确率最高提升73.05%,充分体现了“零性能牺牲”的防御特性。

值得一提的是,本次研究成果是四川大学网络空间安全学院首次以本科生为第一作者、且所有作者均为四川大学网络空间安全学院师生的身份,在机器学习领域三大顶会之一上发表论文,实现了四川大学网络空间安全学院在高水平国际学术会议上的又一重要突破,充分展现了四川大学网络空间安全学院在人工智能安全领域的人才培养质量与科研创新能力。

来源:四川大学网络空间安全学院

推荐阅读

论文从被拒到被接收、引用量猛涨!西安交通大学、中国科学技术大学、南京理工大学青年学者谈论文代码公开的利与弊

AI查重系统频“误判”,学生何时能自证清白?中山大学、东南大学网安学者揭露检测系统技术困局与出路

用AI“写”论文算作弊吗?中山大学、东南大学、兰州大学网安学院导师拆解“真创新”

让论文“跑”起来!如何用开源项目“喂”出实战型网安人才?华中科技大学、西安电子科技大学、重庆邮电大学联手揭秘

信息网络安全

《信息网络安全》创刊于2001年,是由公安部主管,公安部第三研究所、中国计算机学会主办,面向国内外公开发行的国内首批信息安全类期刊之一,于2015年成为中国科技核心期刊,2017年成为中国科学引文数据库来源期刊,2018年成为中文核心期刊,2022年入选CCF计算领域高质量科技期刊分级目录。

中文核心期刊

中国科技核心期刊

中国科学引文数据库来源期刊

CCF计算领域高质量科技期刊

我们在不断努力和完善中,期待您的关注和支持!


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:信息网络安全杂志 《四川大学人工智能安全领域最新研究成果被ICLR 2026接收》

评论:0   参与:  0