CASIA OpenIR

浏览/检索结果: 共106条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Multi-Scale Dynamic Coding Improved Spiking Actor Network for Reinforcement Learning 会议论文
, Online, February 22–March 1, 2022
作者:  Zhang, Duzhen;  Zhang, Tielin;  Jia, Shuncheng;  Xu, Bo
Adobe PDF(2249Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/06/11
Learning in bi-level markov games 会议论文
, Padua, Italy, 2022.7.18-2022.7.23
作者:  Meng Linghui;  Ruan Jingqing;  Xing Dengpeng;  Xu Bo
Adobe PDF(1450Kb)  |  收藏  |  浏览/下载:5/1  |  提交时间:2024/06/11
Concentration Network for Reinforcement Learning of Large-Scale Multi-Agent Systems 会议论文
, online, 2022
作者:  Qingxu Fu;  Tenghai Qiu;  Jianqiang Yi;  Zhiqiang Pu;  Shiguang Wu
Adobe PDF(5807Kb)  |  收藏  |  浏览/下载:12/2  |  提交时间:2024/06/05
A Reinforcement Learning Benchmark for Autonomous Driving in Intersection Scenarios 会议论文
, Orlando, FL, USA, 2022-1-24
作者:  Liu, Yuqi;  Zhang, Qichao;  Zhao, Dongbin
Adobe PDF(1537Kb)  |  收藏  |  浏览/下载:9/6  |  提交时间:2024/06/03
Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文
IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989
作者:  Yang YM(杨依明);  Xing DP(邢登鹏);  Xu B(徐波)
Adobe PDF(2469Kb)  |  收藏  |  浏览/下载:22/7  |  提交时间:2024/05/29
Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning 会议论文
, New Orleans, LA, USA,, November 28 - December 9, 2022
作者:  Zhiwei Xu;  Dapeng Li;  Bin Zhang;  Yuan Zhan;  Yunpeng Bai;  Guoliang Fan
Adobe PDF(4367Kb)  |  收藏  |  浏览/下载:12/3  |  提交时间:2024/05/28
SIDE: State Inference for Partially Observable Cooperative Multi-Agent Reinforcement Learning 会议论文
, Auckland, New Zealand, May 9-13, 2022
作者:  Zhiwei Xu;  Yunpeng Bai;  Dapeng Li;  Bin Zhang;  Guoliang Fan
Adobe PDF(2965Kb)  |  收藏  |  浏览/下载:13/2  |  提交时间:2024/05/28
Learning to Coordinate via Multiple Graph Neural Networks 会议论文
, BALI, Indonesia, December 8-12, 2021
作者:  Zhiwei Xu;  Bin Zhang;  Yunpeng Bai;  Dapeng Li;  Guoliang Fan
Adobe PDF(2047Kb)  |  收藏  |  浏览/下载:19/8  |  提交时间:2024/05/28
基于折扣广义值迭代的智能最优跟踪及应用验证 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 182-193
作者:  王鼎;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(2055Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/05/20
自适应评判控制  可容许性  广义值迭代  智能最优跟踪  神经网络  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:21/9  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性