中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

图片搜索

粘贴图片网址

CASIA OpenIR > 学术期刊 > 自动化学报

	异策略深度强化学习中的经验回放研究综述
	胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny
发表期刊	自动化学报
ISSN	0254-4156
	2023
卷号	49 期号:11 页码:2237-2256
摘要	作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning, DL)结合,深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略强化学习通过将交互经验进行存储和回放,将探索和利用分离开来,更易寻找到全局最优解.如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键.首先对强化学习的基本理论进行介绍;随后对同策略和异策略强化学习算法进行简要介绍;接着介绍经验回放(Experience replay, ER)问题的两种主流解决方案,包括经验利用和经验增广;最后对相关的研究工作进行总结和展望.
关键词	深度强化学习异策略经验回放人工智能
DOI	10.16383/j.aas.c220648
引用统计
文献类型	期刊论文
条目标识符	http://ir.ia.ac.cn/handle/173211/55782
专题	学术期刊_自动化学报
推荐引用方式 GB/T 7714	胡子剑,高晓光,万开方,等. 异策略深度强化学习中的经验回放研究综述[J]. 自动化学报,2023,49(11):2237-2256.
APA	胡子剑,高晓光,万开方,张乐天,汪强龙,&NERETINEvgeny.(2023).异策略深度强化学习中的经验回放研究综述.自动化学报,49(11),2237-2256.
MLA	胡子剑,et al."异策略深度强化学习中的经验回放研究综述".自动化学报 49.11(2023):2237-2256.

条目包含的文件		下载所有文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
AAS-CN-2022-0648.pdf（4679KB）	期刊论文	出版稿	开放获取	CC BY-NC-SA	浏览下载

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[胡子剑]的文章

[高晓光]的文章

[万开方]的文章

百度学术

百度学术中相似的文章

[胡子剑]的文章

[高晓光]的文章

[万开方]的文章

必应学术

必应学术中相似的文章

[胡子剑]的文章

[高晓光]的文章

[万开方]的文章

相关权益政策

收藏/分享

文件名：	AAS-CN-2022-0648.pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量25785
全文量13666
访问量5719373
下载量890842