CASIA OpenIR

浏览/检索结果: 共2条,第1-2条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:204/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
GANs 模型模式坍塌和训练不稳定问题的研究与优化 学位论文
, 中国科学院大学: 中国科学院大学, 2021
作者:  陈莹莹
Adobe PDF(6603Kb)  |  收藏  |  浏览/下载:189/0  |  提交时间:2021/06/22
生成对抗网络模型  模式坍塌  训练不稳定  SVGD 算法  QR 算法