CASIA OpenIR

Browse/Search Results:  1-10 of 220 Help

Selected(0)Clear Items/Page:    Sort:
An Integrated Data Envelopment Analysis and Non-Cooperative Game Approach for Public Transportation Incentive Subsidy Allocation 期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2022, 页码: 16
Authors:  Xie, Qiwei;  Wu, Xiao;  Dai, Qianzhi;  Zheng, Xiaolong;  Wang, Fei-Yue
Favorite  |  View/Download:7/0  |  Submit date:2022/09/19
Resource management  Costs  Government  Games  Industries  Behavioral sciences  Data envelopment analysis  Subsidy allocation  data envelopment analysis  information asymmetry  Nash non-cooperative game  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈皓
Adobe PDF(13782Kb)  |  Favorite  |  View/Download:52/3  |  Submit date:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
边缘信息辅助的图像分割方法研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  何昊
Adobe PDF(63434Kb)  |  Favorite  |  View/Download:50/4  |  Submit date:2022/06/14
语义分割  实例分割  边缘检测  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴士广
Adobe PDF(14260Kb)  |  Favorite  |  View/Download:93/7  |  Submit date:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张朋朋
Adobe PDF(9752Kb)  |  Favorite  |  View/Download:48/4  |  Submit date:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
基于平行学习的混合智能调控方法与应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李小双
Adobe PDF(10128Kb)  |  Favorite  |  View/Download:51/2  |  Submit date:2022/06/20
平行学习  混合智能调控  示教数据  模仿学习  深度强化学习  
VGN: Value Decomposition With Graph Attention Networks for Multiagent Reinforcement Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 页码: 14
Authors:  Wei, Qinglai;  Li, Yugu;  Zhang, Jie;  Wang, Fei-Yue
Favorite  |  View/Download:22/0  |  Submit date:2022/07/25
Mathematical models  Task analysis  Games  Q-learning  Neural networks  Behavioral sciences  Training  Deep learning  graph attention networks (GATs)  multiagent systems  reinforcement learning  
面向复杂对抗的对手行为预测关键技术研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
Authors:  siyuan xing
Adobe PDF(2745Kb)  |  Favorite  |  View/Download:35/4  |  Submit date:2022/06/15
兵棋,位置预测,时空建模,对手建模,异质图网络  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈筱语
Adobe PDF(23947Kb)  |  Favorite  |  View/Download:31/2  |  Submit date:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习  
基于深度强化学习的扁平类物体预抓取操作的研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴家汐
Adobe PDF(26650Kb)  |  Favorite  |  View/Download:38/2  |  Submit date:2022/06/13
预抓取操作  深度强化学习  课程学习