Knowledge Commons of Institute of Automation,CAS
异策略深度强化学习中的经验回放研究综述 | |
胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny | |
发表期刊 | 自动化学报
![]() |
ISSN | 0254-4156 |
2023 | |
卷号 | 49期号:11页码:2237-2256 |
摘要 | 作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning, DL)结合,深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略强化学习通过将交互经验进行存储和回放,将探索和利用分离开来,更易寻找到全局最优解.如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键.首先对强化学习的基本理论进行介绍;随后对同策略和异策略强化学习算法进行简要介绍;接着介绍经验回放(Experience replay, ER)问题的两种主流解决方案,包括经验利用和经验增广;最后对相关的研究工作进行总结和展望. |
关键词 | 深度强化学习 异策略 经验回放 人工智能 |
DOI | 10.16383/j.aas.c220648 |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ia.ac.cn/handle/173211/55782 |
专题 | 学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 胡子剑,高晓光,万开方,等. 异策略深度强化学习中的经验回放研究综述[J]. 自动化学报,2023,49(11):2237-2256. |
APA | 胡子剑,高晓光,万开方,张乐天,汪强龙,&NERETINEvgeny.(2023).异策略深度强化学习中的经验回放研究综述.自动化学报,49(11),2237-2256. |
MLA | 胡子剑,et al."异策略深度强化学习中的经验回放研究综述".自动化学报 49.11(2023):2237-2256. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
AAS-CN-2022-0648.pdf(4679KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[胡子剑]的文章 |
[高晓光]的文章 |
[万开方]的文章 |
百度学术 |
百度学术中相似的文章 |
[胡子剑]的文章 |
[高晓光]的文章 |
[万开方]的文章 |
必应学术 |
必应学术中相似的文章 |
[胡子剑]的文章 |
[高晓光]的文章 |
[万开方]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论