CASIA OpenIR

浏览/检索结果: 共49条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文
IEEE Communications Surveys and Tutorials, 2024, 页码: 50
作者:  Yang,Ning;  Chen,Shuo;  Zhang,Haijun;  Berry,Randall
Adobe PDF(1694Kb)  |  收藏  |  浏览/下载:20/0  |  提交时间:2024/06/01
Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:21/6  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
结合领域知识的因子分析:在金融风险模型上的应用 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 121-132
作者:  冯栩;  喻文健;  李凌
Adobe PDF(1436Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
因子分析  基本面因子  领域知识  风险模型  期望最大化过程  
非侵入式负荷监测综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 644-663
作者:  邓晓平;  张桂青;  魏庆来;  彭伟;  李成栋
Adobe PDF(13303Kb)  |  收藏  |  浏览/下载:14/3  |  提交时间:2024/05/20
非侵入式负荷监测  负荷分解  特征提取  隐马尔科夫模型  深度学习  
基于改进高斯混合模型的机器人运动状态估计 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 8, 页码: 1972-1983
作者:  葛泉波;  王贺彬;  杨秦敏;  张兴国;  刘华平
Adobe PDF(1963Kb)  |  收藏  |  浏览/下载:10/4  |  提交时间:2024/05/20
非线性非高斯系统  状态估计  高斯和容积卡尔曼滤波  鲁棒期望最大化算法  凸组合融合  
深度EM胶囊网络全重叠手写数字识别与分离 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 12, 页码: 2996-3005
作者:  姚红革;  董泽浩;  喻钧;  白小军
Adobe PDF(4650Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/20
深度胶囊网络  重叠数字识别  重叠数字分离  EM向量聚类  
时滞取值概率未知下的线性时滞系统辨识方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 10, 页码: 2136-2144
作者:  刘鑫
Adobe PDF(1474Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/04/24
系统辨识  参数估计  时变时滞  时滞取值概率未知  
Swarm Intelligence Research: From Bio-inspired Single-population Swarm Intelligence to Humanmachine Hybrid Swarm Intelligence 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 121-144
作者:  Guo-Yin Wang;  Dong-Dong Cheng;  De-You Xia;  Hai-Huan Jiang
Adobe PDF(2487Kb)  |  收藏  |  浏览/下载:21/7  |  提交时间:2024/04/23
Swarm intelligence  single-population  multi-population  human-machine hybrid  multi-granularity  
Hierarchical Policy Learning With Demonstration Learning for Robotic Multiple Peg-in-Hole Assembly Tasks 期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2023, 卷号: 19, 期号: 10, 页码: 10254-10264
作者:  Yan, Shaohua;  Xu, De;  Tao, Xian
Adobe PDF(4845Kb)  |  收藏  |  浏览/下载:89/2  |  提交时间:2023/11/17
Assembly model  demonstration learning (DL)  force-based control algorithm  hierarchical reinforcement learning (HRL)  peg-in-hole assembly  
PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文
Proceedings of the AAAI Conference on Artificial Intelligence, 美国 华盛顿, 2023.02.07 - 2023.02.14
作者:  Bai FS(白丰硕);  Zhang HM(张鸿铭);  Tao TY(陶天阳);  Wu ZH(武志亨);  Wang YN(王燕娜);  Xu B(徐博)
Adobe PDF(1663Kb)  |  收藏  |  浏览/下载:177/40  |  提交时间:2023/07/05
Reinforcement Learning Algorithms  Transfer  Domain Adaptation  Multi-Task Learning