CASIA OpenIR

浏览/检索结果: 共158条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
融合自适应评判的随机系统数据驱动策略优化 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990
作者:  王鼎;  王将宇;  乔俊飞
Adobe PDF(2044Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/05/30
自适应评判设计  数据驱动  离散系统  神经网络  Q-learning  随机最优控制  
Learning Playing Piano with Bionic-Constrained Diffusion Policy for Anthropomorphic Hand 期刊论文
Cyborg and Bionic Systems, 2024, 卷号: 5, 页码: 0104
作者:  Yang YM(杨依明);  Wang ZC(王泽昌);  Xing DP(邢登鹏);  Wang P(王鹏)
Adobe PDF(3500Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/30
Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文
Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078
作者:  Qiu JY(邱俊彦);  Haidong Zhang;  Yiping Yang
Adobe PDF(831Kb)  |  收藏  |  浏览/下载:7/1  |  提交时间:2024/05/29
reinforcement learning  dialogue policy learning  curriculum learning  knowledge distillation  
Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文
IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989
作者:  Yang YM(杨依明);  Xing DP(邢登鹏);  Xu B(徐波)
Adobe PDF(2469Kb)  |  收藏  |  浏览/下载:6/1  |  提交时间:2024/05/29
CKDF: Cascaded Knowledge Distillation Framework for Robust Incremental Learning 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2022, 卷号: 31, 页码: 3825–3837
作者:  Li KC(李焜炽);  Wan J(万军);  Yu S(余山)
Adobe PDF(3813Kb)  |  收藏  |  浏览/下载:9/3  |  提交时间:2024/05/28
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:17/5  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:13/7  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
无人机反应式扰动流体路径规划 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287
作者:  吴健发;  王宏伦;  王延祥;  刘一恒
Adobe PDF(4624Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/05/09
无人机  反应式路径规划  受约束扰动流体动态系统  深度强化学习  训练环境