CASIA OpenIR

浏览/检索结果: 共54条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文
IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989
作者:  Yang YM(杨依明);  Xing DP(邢登鹏);  Xu B(徐波)
Adobe PDF(2469Kb)  |  收藏  |  浏览/下载:6/1  |  提交时间:2024/05/29
CKDF: Cascaded Knowledge Distillation Framework for Robust Incremental Learning 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2022, 卷号: 31, 页码: 3825–3837
作者:  Li KC(李焜炽);  Wan J(万军);  Yu S(余山)
Adobe PDF(3813Kb)  |  收藏  |  浏览/下载:9/3  |  提交时间:2024/05/28
Learning Transformer-based Cooperation for Networked Traffic Signal Control 会议论文
, Macau, China, 2022-10
作者:  Zhao, Chen;  Dai, Xingyuan;  Wang, Xiao;  Li, Lingxi;  Lv, Yisheng;  Wang, Fei-Yue
Adobe PDF(1431Kb)  |  收藏  |  浏览/下载:4/2  |  提交时间:2024/05/28
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
Satellite Integration into 5G: Deep Reinforcement Learning for Network Selection 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 2, 页码: 127-137
作者:  Emanuele De Santis;  Alessandro Giuseppi;  Antonio Pietrabissa;  Michael Capponi;  Francesco Delli Priscoli
Adobe PDF(1513Kb)  |  收藏  |  浏览/下载:11/3  |  提交时间:2024/04/23
Network selection  HetNet  deep reinforcement learning  deep-Q-network (DQN)  5G communications  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:196/69  |  提交时间:2023/07/06
MiaoSuan Wargame: A Multi-Mode Integrated Platform for Imperfect Information Game 会议论文
, Beijing, China, August 21-24, 2022
作者:  Jiale Xu;  Jian Hu;  Shixian Wang;  Xuyang Yang;  Wancheng Ni
Adobe PDF(726Kb)  |  收藏  |  浏览/下载:80/26  |  提交时间:2023/06/28
open platform  human-computer gaming  AI evaluation  Turing test  imperfect information game  wargame  
The 2nd Place Solution for CVPR 2022 Workshop on Continual Learning (CLVision, 3rd Edition) Challenge–Track 1: A Replay-based Continual Learning Approach 研究报告
2022
作者:  许涛;  冯航涛;  郑碎武;  杨旭;  刘智勇
Adobe PDF(233Kb)  |  收藏  |  浏览/下载:164/49  |  提交时间:2023/06/28
Real-world learning control for autonomous exploration of a biomimetic robotic shark 期刊论文
IEEE Transactions on Industrial Electronics, 2022, 卷号: 70, 期号: 4, 页码: 3966-3974
作者:  Yan Shuaizheng;  Wu Zhengxing;  Wang Jian;  Huang Yupei;  Tan Min;  Yu Junzhi
Adobe PDF(5981Kb)  |  收藏  |  浏览/下载:151/55  |  提交时间:2023/05/31