CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

已选(0)清除 条数/页:   排序方式:
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:368/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
Multiagent Adversarial Collaborative Learning via Mean-Field Theory 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2021, 卷号: 51, 期号: 10, 页码: 4994-5007
作者:  Luo, Guiyang;  Zhang, Hui;  He, Haibo;  Li, Jinglin;  Wang, Fei-Yue
收藏  |  浏览/下载:175/0  |  提交时间:2021/12/28
Games  Training  Collaborative work  Task analysis  Nash equilibrium  Sociology  Statistics  Adversarial collaborative learning (ACL)  friend-or-foe Q-learning  mean-field theory  multiagent reinforcement learning (MARL)  
Multi-Agent Cooperation and Competition with Two-Level Ggraph Attention Network 会议论文
, 线上, 2020-11
作者:  Shiguang, Wu;  Zhiqiang, Pu;  Jianqiang, Yi;  Huimu, Wang
Adobe PDF(1185Kb)  |  收藏  |  浏览/下载:134/1  |  提交时间:2021/06/24
A Probabilistic Matrix Factorization Method for Link Sign Prediction in Social Networks 会议论文
, New York, NY, USA, July 16-21, 2016
作者:  Luo G(罗冠);  Weiming Hu
浏览  |  Adobe PDF(410Kb)  |  收藏  |  浏览/下载:166/44  |  提交时间:2019/10/08
Clique-based cooperative multiagent reinforcement learning using factor graphs 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2015, 卷号: 3, 期号: 1, 页码: 248-256
作者:  Zhang,Zhen;  Zhao DB(赵冬斌)
浏览  |  Adobe PDF(707Kb)  |  收藏  |  浏览/下载:195/82  |  提交时间:2017/12/30
Reinforcement Learning  Factor Graphs  
基于交互关系的网络社区影响力分析方法 学位论文
, 北京: 中国科学院大学, 2016
作者:  游强
Adobe PDF(2533Kb)  |  收藏  |  浏览/下载:296/5  |  提交时间:2016/06/28
社会影响力  文本交互  融合算法  信任(关系)预测  影响力最大  
Autonomous Maneuvering Decision Research of UAV Based on Experience Knowledge Representation 会议论文
The 28th Chinese Control and Decision Conference, 宁夏银川, 2016/5/28-2016/5/30
作者:  He XM(贺雪梅);  Zu W(祖伟);  Chang HX(常红星);  Gao Y(高阳);  He XM(贺雪梅)
浏览  |  Adobe PDF(1617Kb)  |  收藏  |  浏览/下载:338/96  |  提交时间:2016/06/27
Experiential Knowledge  Bayes  Nash Equilibrium  Air Combat