CASIA OpenIR

浏览/检索结果: 共12条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:578/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
基于图神经网络的视觉图表达方法 学位论文
, 中国科学院自动化所: 中国科学院大学, 2020
作者:  卢毅
Adobe PDF(32080Kb)  |  收藏  |  浏览/下载:349/5  |  提交时间:2020/12/30
图神经网络,图表达,图像分类,语义分割,视觉导航,概率图,深度 强化学习  
面向未知环境自主探索的深度强化学习方法 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李浩然
Adobe PDF(13496Kb)  |  收藏  |  浏览/下载:1036/27  |  提交时间:2020/09/02
移动机器人  深度强化学习  自主探索  智能驾驶  多传感器融合  深度学习  语义分割  
基于深度强化学习的游戏智能决策 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  邵坤
Adobe PDF(13984Kb)  |  收藏  |  浏览/下载:884/31  |  提交时间:2019/06/27
深度强化学习  深度学习  强化学习  智能决策  游戏人工智能  多智能体系统  
面向智能驾驶视觉控制的深度强化学习方法 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  李栋
Adobe PDF(6681Kb)  |  收藏  |  浏览/下载:324/11  |  提交时间:2019/06/27
深度强化学习  智能驾驶  视觉控制  目标检测  图注意力网络  
面向数据高效利用的深度强化学习方法及应用 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  王海涛
Adobe PDF(2611Kb)  |  收藏  |  浏览/下载:398/14  |  提交时间:2016/06/15
人工智能  强化学习  深度学习  经验回放  深度强化学习  数据采样  
基于高斯过程的强化学习及汽车智能巡航控制 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  夏中谱
Adobe PDF(18177Kb)  |  收藏  |  浏览/下载:491/10  |  提交时间:2016/06/15
强化学习控制  高斯过程  连续状态系统  无模型控制  智能巡航控制  
基于监督式自适应动态规划的车辆智能巡航控制 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  王滨
Adobe PDF(2069Kb)  |  收藏  |  浏览/下载:741/2  |  提交时间:2015/09/02
自适应巡航控制  自适应动态规划  监督式强化学习  智能控制  Dspace  Adaptive Cruise Control  Adaptive Dynamic Programming  Supervised Reinforcement Learning  Intelligent Control  Dspace  
连续状态系统的近似最优在线强化学习 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2015
作者:  朱圆恒
Adobe PDF(2679Kb)  |  收藏  |  浏览/下载:493/0  |  提交时间:2015/09/02
强化学习  最优控制  近似策略迭代  概率近似最优  连续状态系统  收敛性  在线学习  Kd树  Reinforcement Learning  Optimal Control  Approximate Policy Iteration  Probably Approximately Correct  Continuous-state System  Convergence  Online Learning  Kd-tree  
城市区域交通信号协调控制 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2012
作者:  戴钰桀
Adobe PDF(1887Kb)  |  收藏  |  浏览/下载:190/0  |  提交时间:2015/09/02
交通信号控制  协调  智能控制  自适应动态规划  强化学习  Traffic Signal Control  Coordination  Intelligent Control  Adaptive Dynamic Programming  Reinforcement Learning