CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:596/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
基于高斯过程的强化学习及汽车智能巡航控制 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  夏中谱
Adobe PDF(18177Kb)  |  收藏  |  浏览/下载:494/10  |  提交时间:2016/06/15
强化学习控制  高斯过程  连续状态系统  无模型控制  智能巡航控制  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  朱圆恒
Adobe PDF(2679Kb)  |  收藏  |  浏览/下载:505/0  |  提交时间:2015/09/02
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree  
城市区域交通信号协调控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2012
作者:  戴钰桀
Adobe PDF(1887Kb)  |  收藏  |  浏览/下载:194/0  |  提交时间:2015/09/02
交通信号控制  协调  智能控制  自适应动态规划  强化学习  Traffic Signal Control  Coordination  Intelligent Control  Adaptive Dynamic Programming  Reinforcement Learning  
基于自适应动态规划的高速路优化控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2010
作者:  白雪瑞
Adobe PDF(1749Kb)  |  收藏  |  浏览/下载:185/3  |  提交时间:2015/09/02
高速路  入口匝道控制  协调控制  自适应动态规划  适合度轨迹  模糊神经网络  Freeway  Ramp Metering  Coordinated Control  Adaptive Dynamic Programming  Eligibility Traces  Neuro-fuzzy Network