CASIA OpenIR

浏览/检索结果: 共13条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于预训练模型的决策序列化建模研究 学位论文
, 2024
作者:  林润基
Adobe PDF(7811Kb)  |  收藏  |  浏览/下载:34/0  |  提交时间:2024/06/07
预训练模型  决策序列化  序列模型  
基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文
, 2024
作者:  王筱琦
Adobe PDF(2737Kb)  |  收藏  |  浏览/下载:18/1  |  提交时间:2024/06/06
兵棋推演  模仿学习  强化学习  人机对抗  
Fuzzy Feedback Multi-Agent Reinforcement Learning for Adversarial Dynamic Multi-Team Competitions 期刊论文
IEEE Transactions on Fuzzy Systems, 2024, 页码: 1
作者:  Qingxu Fu;  Zhiqiang Pu;  Yi Pan;  Tenghai Qiu;  Jianqiang Yi
Adobe PDF(4975Kb)  |  收藏  |  浏览/下载:7/2  |  提交时间:2024/06/05
FM3Q: Factorized Multi-Agent MiniMax Q-Learning for Two-Team Zero-Sum Markov Game 期刊论文
IEEE Transactions on Emerging Topics in Computational Intelligence, 2024, 页码: 1-13
作者:  Guangzheng Hu;  Yuanheng Zhu;  Haoran Li;  Dongbin Zhao
Adobe PDF(2144Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/06/05
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:35/1  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文
IEEE Communications Surveys and Tutorials, 2024, 页码: 50
作者:  Yang,Ning;  Chen,Shuo;  Zhang,Haijun;  Berry,Randall
Adobe PDF(1694Kb)  |  收藏  |  浏览/下载:24/0  |  提交时间:2024/06/01
Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39071Kb)  |  收藏  |  浏览/下载:31/3  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
灵巧手机器人的类人物体交接学习研究 学位论文
, 2024
作者:  段昊男
Adobe PDF(51787Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/05/29
机器人学习  人机交互  物体交接  灵巧手机器人  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:46/5  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估