CASIA OpenIR

浏览/检索结果: 共2条,第1-2条 帮助

已选(0)清除 条数/页:   排序方式:
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:67/17  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能