CASIA OpenIR

浏览/检索结果: 共114条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:42/16  |  提交时间:2024/06/25
强化学习,分层强化学习  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:23/11  |  提交时间:2024/06/25
Minimizing Age of Information for Mobile Edge Computing Systems: A Nested Index Approach 会议论文
, Singapore, 2023/8/24-27
作者:  Chen,Shuo;  Yang,Ning;  Zhang,Meng;  Wang,Jun
Adobe PDF(1413Kb)  |  收藏  |  浏览/下载:53/11  |  提交时间:2024/06/05
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:65/23  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
Parallel Learning Based Foundation Model for Networked Traffic Signal Control 会议论文
, Bilbao, Bizkaia, Spain, 2022-9-24
作者:  Zhao, Chen;  Dai, Xingyuan;  Chen, Yuanyuan;  Yilun, Lin;  Lv, Yisheng;  Wang, Fei-Yue
Adobe PDF(1112Kb)  |  收藏  |  浏览/下载:37/15  |  提交时间:2024/05/28
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:50/14  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
基于宽度混合森林回归的城市固废焚烧过程二噁英排放软测量 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 343-365
作者:  夏恒;  汤健;  崔璨麟;  乔俊飞
Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:35/14  |  提交时间:2024/05/09
城市固废焚烧  二噁英排放建模  宽度学习  宽度混合森林回归  潜在特征  增量学习  
航天器威胁规避智能自主控制技术研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 229-245
作者:  袁利;  姜甜甜
Adobe PDF(2092Kb)  |  收藏  |  浏览/下载:64/19  |  提交时间:2024/05/09
轨道威胁感知  自主决策规划  “感知-决策-执行”一体化  航天器智能自主控制  
航天器位姿运动一体化直接自适应容错控制研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 678-686
作者:  马亚杰;  姜斌;  任好
Adobe PDF(1709Kb)  |  收藏  |  浏览/下载:29/11  |  提交时间:2024/05/09
执行器故障  直接自适应控制  对偶四元数  多执行器故障  近距离操作  
面向性能增强的双惯量伺服系统状态反馈控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 4, 页码: 904-912
作者:  王树波;  那靖;  任雪梅
Adobe PDF(5475Kb)  |  收藏  |  浏览/下载:20/7  |  提交时间:2024/05/09
双惯量伺服系统  状态反馈  预设性能函数  函数逼近器