CASIA OpenIR

浏览/检索结果: 共112条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文
IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989
作者:  Yang YM(杨依明);  Xing DP(邢登鹏);  Xu B(徐波)
Adobe PDF(2469Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/05/29
Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning 会议论文
, New Orleans, LA, USA,, November 28 - December 9, 2022
作者:  Zhiwei Xu;  Dapeng Li;  Bin Zhang;  Yuan Zhan;  Yunpeng Bai;  Guoliang Fan
Adobe PDF(4367Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/28
Learning Transformer-based Cooperation for Networked Traffic Signal Control 会议论文
, Macau, China, 2022-10
作者:  Zhao, Chen;  Dai, Xingyuan;  Wang, Xiao;  Li, Lingxi;  Lv, Yisheng;  Wang, Fei-Yue
Adobe PDF(1431Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/28
SIDE: State Inference for Partially Observable Cooperative Multi-Agent Reinforcement Learning 会议论文
, Auckland, New Zealand, May 9-13, 2022
作者:  Zhiwei Xu;  Yunpeng Bai;  Dapeng Li;  Bin Zhang;  Guoliang Fan
Adobe PDF(2965Kb)  |  收藏  |  浏览/下载:5/1  |  提交时间:2024/05/28
Learning to Coordinate via Multiple Graph Neural Networks 会议论文
, BALI, Indonesia, December 8-12, 2021
作者:  Zhiwei Xu;  Bin Zhang;  Yunpeng Bai;  Dapeng Li;  Guoliang Fan
Adobe PDF(2047Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/05/28
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
微电网的电流均衡/电压恢复自适应动态规划策略研究 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 479-491
作者:  王睿;  孙秋野;  张化光
Adobe PDF(4619Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/05/20
微电网  电流均衡  电压恢复  拓扑同胚  自适应动态规划  
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
机器人运动轨迹的模仿学习综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 315-334
作者:  黄艳龙;  徐德;  谭民
Adobe PDF(4795Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/20
机器人技能学习  模仿学习  运动基元  轨迹学习  
基于事件触发的离散MIMO系统自适应评判容错控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 5, 页码: 1234-1245
作者:  王敏;  黄龙旺;  杨辰光
Adobe PDF(3211Kb)  |  收藏  |  浏览/下载:4/2  |  提交时间:2024/05/20
事件触发控制  自适应评判设计  神经网络  离散非线性系统