CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于ADP的非线性系统自学习最优控制方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  林桥
Adobe PDF(2432Kb)  |  收藏  |  浏览/下载:507/6  |  提交时间:2017/06/16
自适应动态规划  强化学习  神经网络  跟踪控制  饱和系统  
基于自适应动态规划的非线性系统若干控制问题研究 研究报告
2017
作者:  赵博
Adobe PDF(1629Kb)  |  收藏  |  浏览/下载:350/129  |  提交时间:2017/06/19
自适应动态规划  分散控制  容错控制  强化学习  策略迭代  最优控制  神经网络  非线性系统  
智能交互型虚拟角色运动合成方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  王雨萌
Adobe PDF(22448Kb)  |  收藏  |  浏览/下载:266/4  |  提交时间:2017/06/06
角色动画  运动合成  交互式动画  递归神经网络  深度强化学习  
深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文
控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546
作者:  唐振韬;  邵 坤;  赵冬斌;  朱圆恒
Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:207/33  |  提交时间:2021/07/05
深度强化学习  AlphaGo Zero  深度学习  强化学习  人工智能