中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

图片搜索

粘贴图片网址

CASIA OpenIR > 学术期刊 > 自动化学报

	基于因果建模的强化学习控制:现状及展望
	孙悦雯; 柳文章; 孙长银
发表期刊	自动化学报
ISSN	0254-4156
	2023
卷号	49 期号:3 页码:661-677
摘要	基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.
关键词	强化学习控制因果发现因果推理迁移学习表示学习
DOI	10.16383/j.aas.c220823
引用统计
文献类型	期刊论文
条目标识符	http://ir.ia.ac.cn/handle/173211/56187
专题	学术期刊_自动化学报
推荐引用方式 GB/T 7714	孙悦雯,柳文章,孙长银. 基于因果建模的强化学习控制:现状及展望[J]. 自动化学报,2023,49(3):661-677.
APA	孙悦雯,柳文章,&孙长银.(2023).基于因果建模的强化学习控制:现状及展望.自动化学报,49(3),661-677.
MLA	孙悦雯,et al."基于因果建模的强化学习控制:现状及展望".自动化学报 49.3(2023):661-677.

条目包含的文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
AAS-CN-2022-0823.pdf（1926KB）	期刊论文	出版稿	开放获取	CC BY-NC-SA	浏览

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[孙悦雯]的文章

[柳文章]的文章

[孙长银]的文章

百度学术

百度学术中相似的文章

[孙悦雯]的文章

[柳文章]的文章

[孙长银]的文章

必应学术

必应学术中相似的文章

[孙悦雯]的文章

[柳文章]的文章

[孙长银]的文章

相关权益政策

收藏/分享

文件名：	AAS-CN-2022-0823.pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量25852
全文量13690
访问量5881950
下载量927028