CASIA OpenIR

浏览/检索结果: 共3条,第1-3条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:195/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
无权访问的条目 学位论文
作者:  廖泽华
Adobe PDF(2277Kb)  |  收藏  |  浏览/下载:115/3  |  提交时间:2020/06/26
自适应动态规划及其在多智能体中的应用 学位论文
, 北京: 中国科学院大学, 2016
作者:  林汉权
Adobe PDF(2636Kb)  |  收藏  |  浏览/下载:447/12  |  提交时间:2016/06/20
自适应动态规划  强化学习  多智能体  神经网络  高斯过程