已选(0)清除
条数/页: 排序方式: |
| Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang ; Yang Yiming ; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng ; Xu Bo![](/image/person.jpg)
Adobe PDF(7948Kb)  |   收藏  |  浏览/下载:19/7  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang ; Zhang Hongming; Xing Dengpeng ; Bo Xu![](/image/person.jpg)
Adobe PDF(9639Kb)  |   收藏  |  浏览/下载:13/6  |  提交时间:2024/06/25 |
| Learning in bi-level markov games 会议论文 , Padua, Italy, 2022.7.18-2022.7.23 作者: Meng Linghui ; Ruan Jingqing; Xing Dengpeng ; Xu Bo![](/image/person.jpg)
Adobe PDF(1450Kb)  |   收藏  |  浏览/下载:35/12  |  提交时间:2024/06/11 |
| Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604 作者: Kun Jiang; Wenzhang Liu; Yuanda Wang; Lu Dong; Changyin Sun
Adobe PDF(2128Kb)  |   收藏  |  浏览/下载:32/11  |  提交时间:2024/06/07 Latent variable model maximum entropy multi-agent reinforcement learning (MARL) multi-agent system |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬![](/image/person.jpg)
Adobe PDF(37765Kb)  |   收藏  |  浏览/下载:73/7  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| Continuous Exploration via Multiple Perspectives in Sparse Reward Environment 会议论文 , 厦门国际会议中心, 2023-10-13 作者: Chen ZP(陈忠鹏) ; Guan Q(关强)![](/image/person.jpg)
Adobe PDF(2260Kb)  |   收藏  |  浏览/下载:29/9  |  提交时间:2024/06/04 Reinforcement Learning · Exploration Strategy · Sparse Reward · Intrinsic Motivation |
| 基于内在动机的深度强化学习探索策略研究 学位论文 , 2024 作者: 陈忠鹏![](/image/person.jpg)
Adobe PDF(5803Kb)  |   收藏  |  浏览/下载:28/1  |  提交时间:2024/06/04 深度强化学习,内在动机,探索策略,稀疏奖励 |
| Improve the efficiency of deep reinforcement learning through semantic exploration guided by natural language. 会议论文 , 北京华腾美居酒店, 2023-12-9 作者: Zhourui Guo ; Meng Yao; Yang Yu ; Qiyue Yin![](/image/person.jpg)
Adobe PDF(2302Kb)  |   收藏  |  浏览/下载:23/8  |  提交时间:2024/06/03 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:37/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于目标条件强化学习的无监督技能发现方法研究 学位论文 , 2024 作者: 张天![](/image/person.jpg)
Adobe PDF(13799Kb)  |   收藏  |  浏览/下载:28/1  |  提交时间:2024/05/30 目标 稀疏奖励 无监督强化学习 探索 技能策略 |