CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
二人零和动态博弈的自学习平行控制方法研究 学位论文
, 2023
作者:  朱振华
Adobe PDF(1737Kb)  |  收藏  |  浏览/下载:138/6  |  提交时间:2023/12/15
自适应动态规划  平行控制  零和博弈  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:156/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:208/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:621/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
智能机器人共享控制与操作技能学习方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  席宝
Adobe PDF(9051Kb)  |  收藏  |  浏览/下载:327/20  |  提交时间:2021/02/01
位姿检测  共享控制  强化学习  策略梯度  示教引导