CASIA OpenIR

浏览/检索结果: 共409条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning State-Specific Action Masks for Reinforcement Learning 期刊论文
Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60
作者:  Wang ZY(王梓薏);  Li XR(李欣然);  Sun LY(孙罗洋);  Zhang HF(张海峰);  Liu HL(刘华林);  Jun Wang
Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:49/22  |  提交时间:2024/07/05
reinforcement learning  exploration efficiency  space reduction  
动态资讯 2021年 第07期(总第87期) 其他
2021-07-01
作者:  张桂英
Adobe PDF(16033Kb)  |  收藏  |  浏览/下载:35/19  |  提交时间:2024/07/01
Optimizing Reward Function Weights and Enhancing Control Mechanisms for Bipedal Robots Using LSTM and Attention Mechanisms 会议论文
, 河北保定, 2023-8-16
作者:  Cui LZ(崔凌志);  Tianqi Deng;  Lihua Ma;  Wenhao He
Adobe PDF(541Kb)  |  收藏  |  浏览/下载:36/14  |  提交时间:2024/07/01
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:45/17  |  提交时间:2024/06/25
强化学习,分层强化学习  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:29/13  |  提交时间:2024/06/25
Filtered Observations for Model-Based Multi-agent Reinforcement Learning 会议论文
, Turin, Italy, 2023.9.18-2023.9.22
作者:  Meng Linghui;  Xiong Xuantang;  Zang Yifan;  Zhang Xi;  Li Guoqi;  Xing Dengpeng;  Xu Bo
Adobe PDF(841Kb)  |  收藏  |  浏览/下载:57/22  |  提交时间:2024/06/11
基于类脑脉冲神经网络的强化学习算法研究 学位论文
, 2024
作者:  张笃振
Adobe PDF(23167Kb)  |  收藏  |  浏览/下载:78/2  |  提交时间:2024/06/07
类脑智能 脉冲神经网络 强化学习  
Disturbance Observer-Based Predictive Tracking Control of Uncertain HOFA Cyber-Physical Systems 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1711-1713
作者:  Da-Wei Zhang;  Guo-Ping Liu
Adobe PDF(474Kb)  |  收藏  |  浏览/下载:66/28  |  提交时间:2024/06/07
Privacy-Preserving Average Consensus Algorithm Under Round-Robin Scheduling Protocol 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1705-1707
作者:  Yingjiang Guo;  Wenying Xu;  Haodong Wang;  Jianquan Lu;  Shengli Du
Adobe PDF(728Kb)  |  收藏  |  浏览/下载:52/20  |  提交时间:2024/06/07
Finite-Time Stabilization for Constrained Discrete-time Systems by Using Model Predictive Control 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1656-1666
作者:  Bing Zhu;  Xiaozhuoer Yuan;  Li Dai;  Zhiwen Qiang
Adobe PDF(1749Kb)  |  收藏  |  浏览/下载:61/23  |  提交时间:2024/06/07
Constraints  deadbeat control  finite-time stabilization  model predictive control (MPC)