CASIA OpenIR  > 学术期刊  > 自动化学报
面向对抗样本的深度神经网络可解释性分析
董胤蓬; 苏航; 朱军
Source Publication自动化学报
ISSN0254-4156
2022
Volume48Issue:1Pages:75-86
Abstract虽然深度神经网络(Deep neural networks, DNNs)在许多任务上取得了显著的效果,但是由于其可解释性(Interpretability)较差,通常被当做“黑盒”模型.本文针对图像分类任务,利用对抗样本(Adversarial examples)从模型失败的角度检验深度神经网络内部的特征表示.通过分析,发现深度神经网络学习到的特征表示与人类所理解的语义概念之间存在着不一致性.这使得理解和解释深度神经网络内部的特征变得十分困难.为了实现可解释的深度神经网络,使其中的神经元具有更加明确的语义内涵,本文提出了加入特征表示一致性损失的对抗训练方式.实验结果表明该训练方式可以使深度神经网络内部的特征表示与人类所理解的语义概念更加一致.
Keyword深度神经网络 可解释性 对抗样本 视觉特征表示
DOI10.16383/j.aas.c200317
Citation statistics
Document Type期刊论文
Identifierhttp://ir.ia.ac.cn/handle/173211/56430
Collection学术期刊_自动化学报
Recommended Citation
GB/T 7714
董胤蓬,苏航,朱军. 面向对抗样本的深度神经网络可解释性分析[J]. 自动化学报,2022,48(1):75-86.
APA 董胤蓬,苏航,&朱军.(2022).面向对抗样本的深度神经网络可解释性分析.自动化学报,48(1),75-86.
MLA 董胤蓬,et al."面向对抗样本的深度神经网络可解释性分析".自动化学报 48.1(2022):75-86.
Files in This Item: Download All
File Name/Size DocType Version Access License
AAS-CN-2020-0317.pdf(7934KB)期刊论文出版稿开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[董胤蓬]'s Articles
[苏航]'s Articles
[朱军]'s Articles
Baidu academic
Similar articles in Baidu academic
[董胤蓬]'s Articles
[苏航]'s Articles
[朱军]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[董胤蓬]'s Articles
[苏航]'s Articles
[朱军]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: AAS-CN-2020-0317.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.