CASIA OpenIR  > 学术期刊  > 自动化学报
基于通用逆扰动的对抗攻击防御方法
陈晋音; 吴长安; 郑海斌; 王巍; 温浩
发表期刊自动化学报
ISSN0254-4156
2023
卷号49期号:10页码:2172-2187
摘要现有研究表明深度学习模型容易受到精心设计的对抗样本攻击,从而导致模型给出错误的推理结果,引发潜在的安全威胁.已有较多有效的防御方法,其中大多数针对特定攻击方法具有较好防御效果,但由于实际应用中无法预知攻击者可能采用的攻击策略,因此提出不依赖攻击方法的通用防御方法是一个挑战.为此,提出一种基于通用逆扰动(Universal inverse perturbation, UIP)的对抗样本防御方法,通过学习原始数据集中的类相关主要特征,生成通用逆扰动,且UIP对数据样本和攻击方法都具有通用性,即一个UIP可以实现对不同攻击方法作用于整个数据集得到的所有对抗样本进行防御.此外, UIP通过强化良性样本的类相关重要特征实现对良性样本精度的无影响,且生成UIP无需对抗样本的先验知识.通过大量实验验证,表明UIP在不同数据集、不同模型中对各类攻击方法都具备显著的防御效果,且提升了模型对正常样本的分类性能.
关键词深度学习 通用逆扰动 对抗样本 通用防御
DOI10.16383/j.aas.c201077
引用统计
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/56057
专题学术期刊_自动化学报
推荐引用方式
GB/T 7714
陈晋音,吴长安,郑海斌,等. 基于通用逆扰动的对抗攻击防御方法[J]. 自动化学报,2023,49(10):2172-2187.
APA 陈晋音,吴长安,郑海斌,王巍,&温浩.(2023).基于通用逆扰动的对抗攻击防御方法.自动化学报,49(10),2172-2187.
MLA 陈晋音,et al."基于通用逆扰动的对抗攻击防御方法".自动化学报 49.10(2023):2172-2187.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
AAS-CN-2020-1077.pdf(11578KB)期刊论文出版稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[陈晋音]的文章
[吴长安]的文章
[郑海斌]的文章
百度学术
百度学术中相似的文章
[陈晋音]的文章
[吴长安]的文章
[郑海斌]的文章
必应学术
必应学术中相似的文章
[陈晋音]的文章
[吴长安]的文章
[郑海斌]的文章
相关权益政策
暂无数据
收藏/分享
文件名: AAS-CN-2020-1077.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。