已选(0)清除
条数/页: 排序方式: |
| Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu
Adobe PDF(4577Kb)  |   收藏  |  浏览/下载:6/3  |  提交时间:2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining. |
| Optimal Positioning Strategy for Multi-Camera Zooming Drones 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 8, 页码: 1802-1818 作者: Manuel Vargas; Carlos Vivas; Teodoro Alamo
Adobe PDF(6070Kb)  |   收藏  |  浏览/下载:7/3  |  提交时间:2024/07/16 Convex optimization projective transformation unmanned aerial vehicle visual object tracking visual surveillance |
| A Survey on Type-3 Fuzzy Logic Systems and Their Control Applications 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 8, 页码: 1744-1756 作者: Oscar Castillo; Fevrier Valdez; Patricia Melin; Weiping Ding
Adobe PDF(5742Kb)  |   收藏  |  浏览/下载:6/3  |  提交时间:2024/07/16 Applications control systems optimization review type-3 fuzzy logic |
| Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu ; Haifeng Zhang; Jun Wang
Adobe PDF(1339Kb)  |   收藏  |  浏览/下载:18/4  |  提交时间:2024/07/12 |
| Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏) ; Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang
Adobe PDF(2976Kb)  |   收藏  |  浏览/下载:29/12  |  提交时间:2024/07/05 reinforcement learning exploration efficiency space reduction |
| An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文 , 线上, 2020-5 作者: Liu MS(刘民颂) ; Zhu YH(朱圆恒) ; Zhao DB(赵冬斌)![](/image/person.jpg)
Adobe PDF(727Kb)  |   收藏  |  浏览/下载:16/8  |  提交时间:2024/07/04 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:37/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:33/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| 基于强化学习的多无人机协同任务规划技术 学位论文 , 2024 作者: 张梦瑶![](/image/person.jpg)
Adobe PDF(2880Kb)  |   收藏  |  浏览/下载:57/0  |  提交时间:2024/07/04 多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习 |
| Synergetic Learning Neuro-Control for Unknown Affine Nonlinear Systems With Asymptotic Stability Guarantees 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 11 作者: Zhu, Liao ; Wei, Qinglai ; Guo, Ping
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:7/0  |  提交时间:2024/07/03 Approximate dynamic programming (ADP) neural network off-policy optimal control reinforcement learning (RL) |