已选(0)清除
条数/页: 排序方式: |
| 博弈对抗环境中智能策略研究 学位论文 工学博士, 北京: 中国科学院自动化研究所, 2021 作者: 唐振韬 Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:679/17  |  提交时间:2021/07/14 深度强化学习 统计前向规划 策略博弈 智能决策 游戏人工智能 |
| 基于高斯过程的强化学习及汽车智能巡航控制 学位论文 , 北京: 中国科学院研究生院, 2016 作者: 夏中谱 Adobe PDF(18177Kb)  |  收藏  |  浏览/下载:516/10  |  提交时间:2016/06/15 强化学习控制 高斯过程 连续状态系统 无模型控制 智能巡航控制 |
| 连续状态系统的近似最优在线强化学习 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2015 作者: 朱圆恒 Adobe PDF(2679Kb)  |  收藏  |  浏览/下载:530/0  |  提交时间:2015/09/02 强化学习 最优控制 近似策略迭代 概率近似最优 连续状态系统 收敛性 在线学习 Kd树 Reinforcement Learning Optimal Control Approximate Policy Iteration Probably Approximately Correct Continuous-state System Convergence Online Learning Kd-tree |
| 城市区域交通信号协调控制 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2012 作者: 戴钰桀 Adobe PDF(1887Kb)  |  收藏  |  浏览/下载:220/0  |  提交时间:2015/09/02 交通信号控制 协调 智能控制 自适应动态规划 强化学习 Traffic Signal Control Coordination Intelligent Control Adaptive Dynamic Programming Reinforcement Learning |
| 基于自适应动态规划的高速路优化控制 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2010 作者: 白雪瑞 Adobe PDF(1749Kb)  |  收藏  |  浏览/下载:200/3  |  提交时间:2015/09/02 高速路 入口匝道控制 协调控制 自适应动态规划 适合度轨迹 模糊神经网络 Freeway Ramp Metering Coordinated Control Adaptive Dynamic Programming Eligibility Traces Neuro-fuzzy Network |