CASIA OpenIR

浏览/检索结果: 共9条,第1-9条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向智能驾驶视觉控制的深度强化学习方法 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  李栋
Adobe PDF(6681Kb)  |  收藏  |  浏览/下载:321/11  |  提交时间:2019/06/27
深度强化学习  智能驾驶  视觉控制  目标检测  图注意力网络  
面向几类微分博弈的自适应动态规划方法 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  Zhang,Qichao
Adobe PDF(4868Kb)  |  收藏  |  浏览/下载:415/12  |  提交时间:2017/06/07
自适应动态规划  神经网络  微分博弈  
面向数据高效利用的深度强化学习方法及应用 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  王海涛
Adobe PDF(2611Kb)  |  收藏  |  浏览/下载:397/14  |  提交时间:2016/06/15
人工智能  强化学习  深度学习  经验回放  深度强化学习  数据采样  
基于监督式自适应动态规划的车辆智能巡航控制 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  王滨
Adobe PDF(2069Kb)  |  收藏  |  浏览/下载:740/2  |  提交时间:2015/09/02
自适应巡航控制  自适应动态规划  监督式强化学习  智能控制  Dspace  Adaptive Cruise Control  Adaptive Dynamic Programming  Supervised Reinforcement Learning  Intelligent Control  Dspace  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  朱圆恒
Adobe PDF(2679Kb)  |  收藏  |  浏览/下载:485/0  |  提交时间:2015/09/02
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree  
城市区域交通信号协调控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2012
作者:  戴钰桀
Adobe PDF(1887Kb)  |  收藏  |  浏览/下载:190/0  |  提交时间:2015/09/02
交通信号控制  协调  智能控制  自适应动态规划  强化学习  Traffic Signal Control  Coordination  Intelligent Control  Adaptive Dynamic Programming  Reinforcement Learning  
基于SADP的仿人式车辆自适应巡航控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2011
作者:  胡朝辉
Adobe PDF(979Kb)  |  收藏  |  浏览/下载:184/0  |  提交时间:2015/09/02
车辆自适应巡航控制  强化学习  监督学习  监督式强化学习  自适应动态规划  监督式自适应动态规划  Adaptive Cruise Control  Reinforcement Learning  Supervised Learning  Supervised Reinforcement Learning  Adaptive Dynamic Programming  Supervised Adaptive Dynamic Programming  
基于强化学习的城市交通信号优化控制 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2010
作者:  张震
Adobe PDF(12129Kb)  |  收藏  |  浏览/下载:291/0  |  提交时间:2015/09/02
强化学习  交通信号控制  多agent系统  基于基团分解  因子图  一般最大和算法  Reinforcement Learning  Traffic Signal Control  Multiagent Systems  Clique-based Decomposition  Factor Graphs  The General Max-plus Algorithm  
基于自适应动态规划的高速路优化控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2010
作者:  白雪瑞
Adobe PDF(1749Kb)  |  收藏  |  浏览/下载:181/3  |  提交时间:2015/09/02
高速路  入口匝道控制  协调控制  自适应动态规划  适合度轨迹  模糊神经网络  Freeway  Ramp Metering  Coordinated Control  Adaptive Dynamic Programming  Eligibility Traces  Neuro-fuzzy Network