CASIA OpenIR

浏览/检索结果: 共116条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning Superior Cooperative Policy in Competitive Multi-team Reinforcement Learning 会议论文
, Gold Coast, Australia, 2023-6
作者:  Qingxu Fu;  Tenghai Qiu;  Zhiqiang Pu;  Jianqiang Yi;  Xiaolin Ai;  Wanmai Yuan
Adobe PDF(25675Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/06/05
Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:  Qingxu, Fu;  Xiaolin Ai;  Jianqiang Yi;  Tenghai Qiu;  Wanmai Yuan;  Zhiqiang Pu
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:6/1  |  提交时间:2024/06/05
FM3Q: Factorized Multi-Agent MiniMax Q-Learning for Two-Team Zero-Sum Markov Game 期刊论文
IEEE Transactions on Emerging Topics in Computational Intelligence, 2024, 页码: 1-13
作者:  Guangzheng Hu;  Yuanheng Zhu;  Haoran Li;  Dongbin Zhao
Adobe PDF(2144Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/06/05
Concentration Network for Reinforcement Learning of Large-Scale Multi-Agent Systems 会议论文
, online, 2022
作者:  Qingxu Fu;  Tenghai Qiu;  Jianqiang Yi;  Zhiqiang Pu;  Shiguang Wu
Adobe PDF(5807Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/06/05
类脑心理揣测脉冲神经网络模型研究 学位论文
, 2024
作者:  zhao Zhuo ya
Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/06/04
类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
面向多任务和属性泛化的多智能体强化学习算法研究 学位论文
, 2024
作者:  黄上京
Adobe PDF(15636Kb)  |  收藏  |  浏览/下载:25/1  |  提交时间:2024/06/01
多智能体强化学习  多任务强化学习  多智能体属性组成泛化  实体多机器人平台  
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文
IEEE Communications Surveys and Tutorials, 2024, 页码: 50
作者:  Yang,Ning;  Chen,Shuo;  Zhang,Haijun;  Berry,Randall
Adobe PDF(1694Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/06/01
Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:24/0  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39071Kb)  |  收藏  |  浏览/下载:24/1  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统