Explainable Reinforcement Learning via a Causal World Model
Yu ZY(余忠蔚); Ruan JQ(阮景晴); Xing DP(邢登鹏)
2023-08
会议名称International Joint Conference on Artificial Intelligence
会议录名称Proceedings of the 32nd International Joint Conference on Artificial Intelligence
页码4540-4548
会议日期2023-08-22
会议地点中国澳门
摘要

Generating explanations for reinforcement learning (RL) is challenging as actions may produce long-term effects on the future. In this paper, we develop a novel framework for explainable RL by learning a causal world model without prior knowledge of the causal structure of the environment. The model captures the influence of actions, allowing us to interpret the long-term effects of actions through causal chains, which present how actions influence environmental variables and finally lead to rewards. Different from most explanatory models which suffer from low accuracy, our model remains accurate while improving explainability, making it applicable in model-based learning. As a result, we demonstrate that our causal model can serve as the bridge between explainability and learning.

关键词强化学习 可解释人工智能 因果推理
学科门类工学::计算机科学与技术(可授工学、理学学位)
收录类别EI
语种英语
七大方向——子方向分类机器学习
国重实验室规划方向分类可解释人工智能
是否有论文关联数据集需要存交
文献类型会议论文
条目标识符http://ir.ia.ac.cn/handle/173211/56585
专题多模态人工智能系统全国重点实验室
作者单位中国科学院自动化研究所
第一作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
Yu ZY,Ruan JQ,Xing DP. Explainable Reinforcement Learning via a Causal World Model[C],2023:4540-4548.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
0505.pdf(850KB)会议论文 开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[Yu ZY(余忠蔚)]的文章
[Ruan JQ(阮景晴)]的文章
[Xing DP(邢登鹏)]的文章
百度学术
百度学术中相似的文章
[Yu ZY(余忠蔚)]的文章
[Ruan JQ(阮景晴)]的文章
[Xing DP(邢登鹏)]的文章
必应学术
必应学术中相似的文章
[Yu ZY(余忠蔚)]的文章
[Ruan JQ(阮景晴)]的文章
[Xing DP(邢登鹏)]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 0505.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。