CASIA OpenIR  > 学术期刊  > 自动化学报
异策略深度强化学习中的经验回放研究综述
胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny
发表期刊自动化学报
ISSN0254-4156
2023
卷号49期号:11页码:2237-2256
摘要作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning, DL)结合,深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略强化学习通过将交互经验进行存储和回放,将探索和利用分离开来,更易寻找到全局最优解.如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键.首先对强化学习的基本理论进行介绍;随后对同策略和异策略强化学习算法进行简要介绍;接着介绍经验回放(Experience replay, ER)问题的两种主流解决方案,包括经验利用和经验增广;最后对相关的研究工作进行总结和展望.
关键词深度强化学习 异策略 经验回放 人工智能
DOI10.16383/j.aas.c220648
引用统计
文献类型期刊论文
条目标识符http://ir.ia.ac.cn/handle/173211/55782
专题学术期刊_自动化学报
推荐引用方式
GB/T 7714
胡子剑,高晓光,万开方,等. 异策略深度强化学习中的经验回放研究综述[J]. 自动化学报,2023,49(11):2237-2256.
APA 胡子剑,高晓光,万开方,张乐天,汪强龙,&NERETINEvgeny.(2023).异策略深度强化学习中的经验回放研究综述.自动化学报,49(11),2237-2256.
MLA 胡子剑,et al."异策略深度强化学习中的经验回放研究综述".自动化学报 49.11(2023):2237-2256.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
AAS-CN-2022-0648.pdf(4679KB)期刊论文出版稿开放获取CC BY-NC-SA浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[胡子剑]的文章
[高晓光]的文章
[万开方]的文章
百度学术
百度学术中相似的文章
[胡子剑]的文章
[高晓光]的文章
[万开方]的文章
必应学术
必应学术中相似的文章
[胡子剑]的文章
[高晓光]的文章
[万开方]的文章
相关权益政策
暂无数据
收藏/分享
文件名: AAS-CN-2022-0648.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。