CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:292/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
作者:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:242/48  |  提交时间:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:318/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配