CASIA OpenIR  > 学术期刊  > 自动化学报
基于通用逆扰动的对抗攻击防御方法
陈晋音; 吴长安; 郑海斌; 王巍; 温浩
Source Publication自动化学报
ISSN0254-4156
2023
Volume49Issue:10Pages:2172-2187
Abstract现有研究表明深度学习模型容易受到精心设计的对抗样本攻击,从而导致模型给出错误的推理结果,引发潜在的安全威胁.已有较多有效的防御方法,其中大多数针对特定攻击方法具有较好防御效果,但由于实际应用中无法预知攻击者可能采用的攻击策略,因此提出不依赖攻击方法的通用防御方法是一个挑战.为此,提出一种基于通用逆扰动(Universal inverse perturbation, UIP)的对抗样本防御方法,通过学习原始数据集中的类相关主要特征,生成通用逆扰动,且UIP对数据样本和攻击方法都具有通用性,即一个UIP可以实现对不同攻击方法作用于整个数据集得到的所有对抗样本进行防御.此外, UIP通过强化良性样本的类相关重要特征实现对良性样本精度的无影响,且生成UIP无需对抗样本的先验知识.通过大量实验验证,表明UIP在不同数据集、不同模型中对各类攻击方法都具备显著的防御效果,且提升了模型对正常样本的分类性能.
Keyword深度学习 通用逆扰动 对抗样本 通用防御
DOI10.16383/j.aas.c201077
Citation statistics
Document Type期刊论文
Identifierhttp://ir.ia.ac.cn/handle/173211/56057
Collection学术期刊_自动化学报
Recommended Citation
GB/T 7714
陈晋音,吴长安,郑海斌,等. 基于通用逆扰动的对抗攻击防御方法[J]. 自动化学报,2023,49(10):2172-2187.
APA 陈晋音,吴长安,郑海斌,王巍,&温浩.(2023).基于通用逆扰动的对抗攻击防御方法.自动化学报,49(10),2172-2187.
MLA 陈晋音,et al."基于通用逆扰动的对抗攻击防御方法".自动化学报 49.10(2023):2172-2187.
Files in This Item: Download All
File Name/Size DocType Version Access License
AAS-CN-2020-1077.pdf(11578KB)期刊论文出版稿开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[陈晋音]'s Articles
[吴长安]'s Articles
[郑海斌]'s Articles
Baidu academic
Similar articles in Baidu academic
[陈晋音]'s Articles
[吴长安]'s Articles
[郑海斌]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[陈晋音]'s Articles
[吴长安]'s Articles
[郑海斌]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: AAS-CN-2020-1077.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.