已选(0)清除
条数/页: 排序方式: |
| Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu
Adobe PDF(4577Kb)  |   收藏  |  浏览/下载:6/3  |  提交时间:2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining. |
| Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊 创刊日期: 2018, 主办者: Liu BY(刘博寅)
Adobe PDF(5797Kb)  |   收藏  |  浏览/下载:21/5  |  提交时间:2024/07/12 |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅)![](/image/person.jpg)
Adobe PDF(6675Kb)  |   收藏  |  浏览/下载:16/2  |  提交时间:2024/07/12 |
| Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu ; Haifeng Zhang; Jun Wang
Adobe PDF(1339Kb)  |   收藏  |  浏览/下载:18/4  |  提交时间:2024/07/12 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:34/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| A Bio-Inspired Integration Model of Basal Ganglia and Cerebellum for Motion Learning of a Musculoskeletal Robot 期刊论文 JOURNAL OF SYSTEMS SCIENCE & COMPLEXITY, 2024, 卷号: 37, 期号: 1, 页码: 82-113 作者: Zhang, Jinhan; Chen, Jiahao ; Zhong, Shanlin ; Qiao, Hong![](/image/person.jpg)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:7/0  |  提交时间:2024/07/03 Basal ganglia and cerebellum bio-inspired integration model motion learning muscu-loskeletal robot reinforcement learning |
| Synergetic Learning Neuro-Control for Unknown Affine Nonlinear Systems With Asymptotic Stability Guarantees 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 11 作者: Zhu, Liao ; Wei, Qinglai ; Guo, Ping
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:7/0  |  提交时间:2024/07/03 Approximate dynamic programming (ADP) neural network off-policy optimal control reinforcement learning (RL) |
| 自适应分布式聚合博弈广义纳什均衡算法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220 作者: 时侠圣; 任璐; 孙长银
Adobe PDF(1595Kb)  |   收藏  |  浏览/下载:17/7  |  提交时间:2024/07/02 聚合博弈 自适应 比例积分 梯度跟踪 一般线性多智能体系统 |
| 基于自组织递归小波神经网络的污水处理过程多变量控制 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1199-1209 作者: 苏尹; 杨翠丽; 乔俊飞
Adobe PDF(3815Kb)  |   收藏  |  浏览/下载:22/11  |  提交时间:2024/07/02 神经网络控制 污水处理过程 自组织机制 多变量控制 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |