CASIA OpenIR

浏览/检索结果: 共234条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Deep Reinforcement Learning or Lyapunov Analysis? A Preliminary Comparative Study on Event-Triggered Optimal Control 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1702-1704
作者:  Jingwei Lu;  Lefei Li;  Qinglai Wei;  Fei-Yue Wang
Adobe PDF(501Kb)  |  收藏  |  浏览/下载:12/6  |  提交时间:2024/06/07
Parallel Population and Parallel Human---A Cyber-Physical Social Approach 期刊论文
IEEE Intelligent Systems, 2022, 卷号: 37, 期号: 5, 页码: 19-27
作者:  Peijun Ye;  Fei-Yue Wang
Adobe PDF(3009Kb)  |  收藏  |  浏览/下载:19/3  |  提交时间:2024/06/06
Parallel Human  
基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文
, 2024
作者:  王筱琦
Adobe PDF(2737Kb)  |  收藏  |  浏览/下载:19/1  |  提交时间:2024/06/06
兵棋推演  模仿学习  强化学习  人机对抗  
FM3Q: Factorized Multi-Agent MiniMax Q-Learning for Two-Team Zero-Sum Markov Game 期刊论文
IEEE Transactions on Emerging Topics in Computational Intelligence, 2024, 页码: 1-13
作者:  Guangzheng Hu;  Yuanheng Zhu;  Haoran Li;  Dongbin Zhao
Adobe PDF(2144Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/06/05
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:40/2  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
类脑脉冲神经网络模型优化方法研究 学位论文
, 2024
作者:  李杨
Adobe PDF(7989Kb)  |  收藏  |  浏览/下载:22/1  |  提交时间:2024/06/04
脉冲神经网络优化  人工神经网络-脉冲神经网络转换  时空反向传播  时序高效知识蒸馏  高性能低延迟  
基于内在动机的深度强化学习探索策略研究 学位论文
, 2024
作者:  陈忠鹏
Adobe PDF(5803Kb)  |  收藏  |  浏览/下载:16/1  |  提交时间:2024/06/04
深度强化学习,内在动机,探索策略,稀疏奖励  
面向交叉路口通行的自动驾驶强化学习方法 学位论文
, 2024
作者:  刘育琦
Adobe PDF(24247Kb)  |  收藏  |  浏览/下载:10/2  |  提交时间:2024/06/03
深度强化学习  自动驾驶  交叉路口通行  场景集  安全强化学习  图卷积网络  
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文
IEEE Communications Surveys and Tutorials, 2024, 页码: 50
作者:  Yang,Ning;  Chen,Shuo;  Zhang,Haijun;  Berry,Randall
Adobe PDF(1694Kb)  |  收藏  |  浏览/下载:28/1  |  提交时间:2024/06/01
Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication  
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:25/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制