CASIA OpenIR

浏览/检索结果: 共48条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Soft Contrastive Learning with Q-irrelevance Abstraction for Reinforcement Learning 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2023, 卷号: 15, 期号: 3, 页码: 1463 - 1473
作者:  Liu MS(刘民颂);  Li LT(李伦通);  Hao S(郝帅);  Zhu YH(朱圆恒);  Zhao DB(赵冬斌)
Adobe PDF(4197Kb)  |  收藏  |  浏览/下载:37/13  |  提交时间:2024/06/24
Multi-objective Deep Reinforcement Learning for Mobile Edge Computing 会议论文
, Singapore, 2023/8/24-27
作者:  Yang,Ning;  Wen,Junrui;  Zhang,Meng;  Tang,Ming
Adobe PDF(499Kb)  |  收藏  |  浏览/下载:48/18  |  提交时间:2024/06/05
mobile edge computing  multi-objective reinforcement learning  resource scheduling  
Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:  Qingxu, Fu;  Xiaolin Ai;  Jianqiang Yi;  Tenghai Qiu;  Wanmai Yuan;  Zhiqiang Pu
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:39/12  |  提交时间:2024/06/05
Advancing Air Combat Tactics with Improved Neural Fictitious Self-Play Reinforcement Learning 会议论文
Advanced Intelligent Computing Technology and Applications, 中国郑州, 2023-8
作者:  He SQ(何少钦);  Gao Y(高阳);  Zhang BF(张保丰);  Chang H(常惠);  Zhang XC(张鑫辰)
Adobe PDF(1496Kb)  |  收藏  |  浏览/下载:57/21  |  提交时间:2024/05/31
Air Combat, Reinforcement Learning, Neural Fictitious Self-Play.  
Triple Robustness Augmentation Local Features for multi-source image registration 期刊论文
ISPRS Journal of Photogrammetry and Remote Sensing, 2023, 卷号: 199, 期号: 0, 页码: 1-14
作者:  Changwei Wang;  Lele Xu;  Rongtao Xu;  Shibiao Xu;  Weiliang Meng;  Ruisheng Wang;  Xiaopeng Zhang
Adobe PDF(6581Kb)  |  收藏  |  浏览/下载:48/14  |  提交时间:2024/05/29
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:54/20  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:42/12  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:31/10  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
支持重规划的战时保障动态调度研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 7, 页码: 1519-1529
作者:  曾斌;  樊旭;  李厚朴
Adobe PDF(1581Kb)  |  收藏  |  浏览/下载:52/15  |  提交时间:2024/04/25
战时保障  重规划  马尔科夫决策过程  动态调度  强化学习  
Effective Model Compression via Stage-wise Pruning 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 6, 页码: 937-951
作者:  Ming-Yang Zhang;  Xin-Yi Yu;  Lin-Lin Ou
Adobe PDF(2394Kb)  |  收藏  |  浏览/下载:31/13  |  提交时间:2024/04/23
Automated machine learning (AutoML), channel pruning, model compression, distillation, convolutional neural networks (CNN)