CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:25/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于演化学习与对手策略的不完美信息博弈算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  张蒙
Adobe PDF(2515Kb)  |  收藏  |  浏览/下载:368/9  |  提交时间:2021/06/20
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成  
基于混合更新Q值的深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李主南
Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:200/5  |  提交时间:2020/06/10
深度强化学习  Q 学习算法  过估计  欠估计  Actor-Critic  凸组合  混合更新  
Dynamic Programming Field Based Environment Learning and Path Planning for Mobile Robots 会议论文
IEEE World Congresson Intelligent Control and Automation (WCICA), Jinan, China, July 6-9
作者:  Yuan, Yuan;  Cao, Zhiqiang;  Hou, Zengguang;  Tan, Min
Adobe PDF(1242Kb)  |  收藏  |  浏览/下载:154/23  |  提交时间:2015/08/19