CASIA OpenIR

浏览/检索结果: 共18条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Learning to Navigate in Human Environments via Deep Reinforcement Learning 会议论文
, Sydney, Australia, 2019-12-12至2019-12-15
作者:  Xingyuan Gao;  Shiying Sun;  Xiaoguang Zhao;  Min Tan
Adobe PDF(1298Kb)  |  收藏  |  浏览/下载:149/44  |  提交时间:2022/03/31
Conservative Policy Gradient in Multi-critic Setting 会议论文
, Hangzhou, China, 2019.11.22-24
作者:  Xi, Bao;  Wang, Rui;  Wang, Shuo;  Lu, Tao;  Cai, Yinghao
Adobe PDF(379Kb)  |  收藏  |  浏览/下载:185/63  |  提交时间:2021/02/02
inconsistancy  stablility  Q learning  policy gradient  
Fast A3RL: Aesthetics-Aware Adversarial Reinforcement Learning for Image Cropping 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2019, 卷号: 28, 期号: 10, 页码: 5105-5120
作者:  Li, Debang;  Wu, Huikai;  Zhang, Junge;  Huang, Kaiqi
Adobe PDF(6588Kb)  |  收藏  |  浏览/下载:367/41  |  提交时间:2019/12/16
Reinforcement learning  adversarial learning  image cropping  
Adaptive Tracking Control of Surface Vessel Using Optimized Backstepping Technique 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2019, 卷号: 49, 期号: 9, 页码: 3420-3431
作者:  Wen, Guoxing;  Ge, Shuzhi Sam;  Chen, C. L. Philip;  Tu, Fangwen;  Wang, Shengnan
收藏  |  浏览/下载:171/0  |  提交时间:2019/12/16
Actor-critic architecture  Lyapunov stability  optimized backstepping (OB)  reinforcement learning (RL)  surface vessel  
Optimized Adaptive Nonlinear Tracking Control Using Actor-Critic Reinforcement Learning Strategy 期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2019, 卷号: 15, 期号: 9, 页码: 4969-4977
作者:  Wen, Guoxing;  Chen, C. L. Philip;  Ge, Shuzhi Sam;  Yang, Hongli;  Liu, Xiaoguang
收藏  |  浏览/下载:208/0  |  提交时间:2019/12/16
Lyapunov function  neural networks (NNs)  nonlinear systems  optimized tracking control  reinforcement learning (RL) of actor-critic architecture  
Data-Based Reinforcement Learning for Nonzero-Sum Games With Unknown Drift Dynamics 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2019, 卷号: 49, 期号: 8, 页码: 2874-2885
作者:  Zhang, Qichao;  Zhao, Dongbin
浏览  |  Adobe PDF(1021Kb)  |  收藏  |  浏览/下载:407/120  |  提交时间:2019/07/12
Integral reinforcement learning (IRL)  neural network (NN)  nonzero-sum (NZS) games  off-policy  single-critic  unknown drift dynamics  
Autonomous Navigation with Improved Hierarchical Neural Network Based on Deep Reinforcement Learning 会议论文
, 中国 广州, 2019.07.27-2019.07.30
作者:  Zhang, Haiying;  Qiu, Tenghai;  Li, Shuxiao;  Zhu, Chengfei;  Lan, Xiaosong;  Chang, Hongxing
浏览  |  Adobe PDF(349Kb)  |  收藏  |  浏览/下载:274/90  |  提交时间:2020/06/09
Autonomous Navigation  DDPG  Improved Hierarchical Neural Network  Curriculum Learning  
类脑自主学习与决策神经网络模型 学位论文
, 中国科学院大学: 中国科学院自动化化研究所, 2019
作者:  赵菲菲
Adobe PDF(16032Kb)  |  收藏  |  浏览/下载:770/18  |  提交时间:2019/06/05
类脑自主学习与决策  多脑区协同  脉冲神经网络  发育神经网络  微观可塑性  视觉恐惧反应模型  无人机自主决策  
平行学习理论及其在智能交通系统中的应用 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  林懿伦
Adobe PDF(17378Kb)  |  收藏  |  浏览/下载:424/4  |  提交时间:2019/07/15
平行学习  强化学习  深度学习  智能交通系统  
基于深度学习的视觉目标跟踪方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
作者:  赵飞
Adobe PDF(37107Kb)  |  收藏  |  浏览/下载:319/13  |  提交时间:2019/06/04
视觉目标跟踪  深度学习  强化学习  对抗学习