CASIA OpenIR

浏览/检索结果: 共22条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向兵棋推演的多智能体智能博弈决策算法研究 学位论文
, 2023
作者:  余照科
Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:688/34  |  提交时间:2023/01/31
请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:372/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
, 2023
作者:  白云鹏
Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:150/9  |  提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:146/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于深度强化学习的群体协同策略方法研究 学位论文
, 2023
作者:  张天乐
Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:156/9  |  提交时间:2023/06/12
群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习  
执行者-评论家算法框架下的强化学习稳定性研究 学位论文
, 2023
作者:  龚晨
Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:96/6  |  提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击  
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
作者:  杨光开
Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:216/7  |  提交时间:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:198/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
基于演示示教的机器人技能模仿学习 学位论文
, 智能化大厦: 中科院自动化所, 2021
作者:  夏鹏程
Adobe PDF(16930Kb)  |  收藏  |  浏览/下载:224/12  |  提交时间:2021/06/18
演示示教  域自适应  轨迹模仿  深度强化学习  
智能机器人共享控制与操作技能学习方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  席宝
Adobe PDF(9051Kb)  |  收藏  |  浏览/下载:320/20  |  提交时间:2021/02/01
位姿检测  共享控制  强化学习  策略梯度  示教引导