CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:578/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
面向几类微分博弈的自适应动态规划方法 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  Zhang,Qichao
Adobe PDF(4868Kb)  |  收藏  |  浏览/下载:415/12  |  提交时间:2017/06/07
自适应动态规划  神经网络  微分博弈  
非稳态环境下的数据流在线变化检测 学位论文
, 北京: 中国科学院大学, 2017
作者:  卜丽
Adobe PDF(10095Kb)  |  收藏  |  浏览/下载:284/4  |  提交时间:2017/06/20
非稳态变化  数据流  适时学习  在线变化检测  最小二乘密度差估计  
基于高斯过程的强化学习及汽车智能巡航控制 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  夏中谱
Adobe PDF(18177Kb)  |  收藏  |  浏览/下载:490/10  |  提交时间:2016/06/15
强化学习控制  高斯过程  连续状态系统  无模型控制  智能巡航控制  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  朱圆恒
Adobe PDF(2679Kb)  |  收藏  |  浏览/下载:493/0  |  提交时间:2015/09/02
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree  
城市区域交通信号协调控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2012
作者:  戴钰桀
Adobe PDF(1887Kb)  |  收藏  |  浏览/下载:190/0  |  提交时间:2015/09/02
交通信号控制  协调  智能控制  自适应动态规划  强化学习  Traffic Signal Control  Coordination  Intelligent Control  Adaptive Dynamic Programming  Reinforcement Learning  
基于自适应动态规划的高速路优化控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2010
作者:  白雪瑞
Adobe PDF(1749Kb)  |  收藏  |  浏览/下载:182/3  |  提交时间:2015/09/02
高速路  入口匝道控制  协调控制  自适应动态规划  适合度轨迹  模糊神经网络  Freeway  Ramp Metering  Coordinated Control  Adaptive Dynamic Programming  Eligibility Traces  Neuro-fuzzy Network