CASIA OpenIR  > 学术期刊  > 自动化学报
基于因果建模的强化学习控制:现状及展望
孙悦雯; 柳文章; 孙长银
Source Publication自动化学报
ISSN0254-4156
2023
Volume49Issue:3Pages:661-677
Abstract基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.
Keyword强化学习控制 因果发现 因果推理 迁移学习 表示学习
DOI10.16383/j.aas.c220823
Citation statistics
Document Type期刊论文
Identifierhttp://ir.ia.ac.cn/handle/173211/56187
Collection学术期刊_自动化学报
Recommended Citation
GB/T 7714
孙悦雯,柳文章,孙长银. 基于因果建模的强化学习控制:现状及展望[J]. 自动化学报,2023,49(3):661-677.
APA 孙悦雯,柳文章,&孙长银.(2023).基于因果建模的强化学习控制:现状及展望.自动化学报,49(3),661-677.
MLA 孙悦雯,et al."基于因果建模的强化学习控制:现状及展望".自动化学报 49.3(2023):661-677.
Files in This Item: Download All
File Name/Size DocType Version Access License
AAS-CN-2022-0823.pdf(1926KB)期刊论文出版稿开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[孙悦雯]'s Articles
[柳文章]'s Articles
[孙长银]'s Articles
Baidu academic
Similar articles in Baidu academic
[孙悦雯]'s Articles
[柳文章]'s Articles
[孙长银]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[孙悦雯]'s Articles
[柳文章]'s Articles
[孙长银]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: AAS-CN-2022-0823.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.