已选(0)清除
条数/页: 排序方式: |
| Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800 作者: Jingqing Ruan; Kaishen Wang; Qingyang Zhang; Dengpeng Xing; Bo Xu
Adobe PDF(4577Kb)  |   收藏  |  浏览/下载:27/12  |  提交时间:2024/07/18 Reinforcement learning representation learning subtask planning task decomposition pretraining. |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅)![](/image/person.jpg)
Adobe PDF(6675Kb)  |   收藏  |  浏览/下载:29/5  |  提交时间:2024/07/12 |
| Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu ; Haifeng Zhang; Jun Wang
Adobe PDF(1339Kb)  |   收藏  |  浏览/下载:33/10  |  提交时间:2024/07/12 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:44/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| 自适应分布式聚合博弈广义纳什均衡算法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220 作者: 时侠圣; 任璐; 孙长银
Adobe PDF(1595Kb)  |   收藏  |  浏览/下载:29/16  |  提交时间:2024/07/02 聚合博弈 自适应 比例积分 梯度跟踪 一般线性多智能体系统 |
| 基于自组织递归小波神经网络的污水处理过程多变量控制 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1199-1209 作者: 苏尹; 杨翠丽; 乔俊飞
Adobe PDF(3815Kb)  |   收藏  |  浏览/下载:39/20  |  提交时间:2024/07/02 神经网络控制 污水处理过程 自组织机制 多变量控制 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 面向算力网络的智慧调度综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103 作者: 李逸博; 李小平; 王爽; 蒋嶷川
Adobe PDF(1752Kb)  |   收藏  |  浏览/下载:27/19  |  提交时间:2024/07/02 算力网络 云计算 边缘计算 资源调度 知识 |
| 双足机器人步态生成的研究 学位论文 , 2024 作者: 崔凌志![](/image/person.jpg)
Adobe PDF(7077Kb)  |   收藏  |  浏览/下载:43/1  |  提交时间:2024/07/01 请双足机器人控制 混合零动力 轨迹自由强化学习 周期性步态奖励机制 动态步态优化 模型融合策略 |
| 自然语言嵌入的深度强化学习探索方法研究 学位论文 , 2024 作者: 郭洲蕊![](/image/person.jpg)
Adobe PDF(7588Kb)  |   收藏  |  浏览/下载:46/1  |  提交时间:2024/06/26 深度强化学习 自然语言 探索 |