CASIA OpenIR

浏览/检索结果: 共1条,第1-1条 帮助

已选(0)清除 条数/页:   排序方式:
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:198/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习