CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
基于表示学习和对手建模的动态博弈系统策略生成技术研究 学位论文
, 2023
作者:  詹员
Adobe PDF(12738Kb)  |  收藏  |  浏览/下载:125/8  |  提交时间:2023/06/06
深度强化学习  表示学习  对手建模  空中博弈  
执行者-评论家算法框架下的强化学习稳定性研究 学位论文
, 2023
作者:  龚晨
Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:96/6  |  提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击  
基于计算实验的区域路网交通信号控制研究 学位论文
, 北京: 中国科学院大学, 2016
作者:  刘裕良
Adobe PDF(5332Kb)  |  收藏  |  浏览/下载:215/2  |  提交时间:2016/06/27
计算实验  交通信号控制  区域路网  集成自适应动态规划  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  朱圆恒
Adobe PDF(2679Kb)  |  收藏  |  浏览/下载:499/0  |  提交时间:2015/09/02
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree  
基于数据的自适应动态规划最优控制与微分博弈研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  李宏亮
Adobe PDF(2578Kb)  |  收藏  |  浏览/下载:1103/0  |  提交时间:2015/09/02
智能控制  自适应动态规划  神经网络  最优控制  微分博弈  Intelligent Control  Adaptive Dynamic Programming  Neural Networks  Optimal Controldifferential Games  Differential Games