CASIA OpenIR

浏览/检索结果: 共18条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向多智能体协作的注意力意图与交流学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325
作者:  俞文武;  杨晓亚;  李海昌;  王瑞;  胡晓惠
Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:17/9  |  提交时间:2024/04/18
多智能体  强化学习  意图交流  注意力机制  
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:86/2  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:148/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
, 2023
作者:  白云鹏
Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:152/9  |  提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心  
基于深度强化学习的群体协同策略方法研究 学位论文
, 2023
作者:  张天乐
Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:159/9  |  提交时间:2023/06/12
群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
作者:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:431/68  |  提交时间:2022/07/12
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:187/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
作者:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:213/37  |  提交时间:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:294/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴士广
Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:384/24  |  提交时间:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络