已选(0)清除
条数/页: 排序方式: |
| Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文 , Nanjing, 2023-11-27 作者: Yuqiao Wu ; Haifeng Zhang; Jun Wang
Adobe PDF(1339Kb)  |   收藏  |  浏览/下载:9/1  |  提交时间:2024/07/12 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang ; Zhang Hongming; Xing Dengpeng ; Bo Xu![](/image/person.jpg)
Adobe PDF(9639Kb)  |   收藏  |  浏览/下载:14/7  |  提交时间:2024/06/25 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥![](/image/person.jpg)
Adobe PDF(16716Kb)  |   收藏  |  浏览/下载:32/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| Learning in bi-level markov games 会议论文 , Padua, Italy, 2022.7.18-2022.7.23 作者: Meng Linghui ; Ruan Jingqing; Xing Dengpeng ; Xu Bo![](/image/person.jpg)
Adobe PDF(1450Kb)  |   收藏  |  浏览/下载:35/12  |  提交时间:2024/06/11 |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬![](/image/person.jpg)
Adobe PDF(37765Kb)  |   收藏  |  浏览/下载:73/7  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| 类脑脉冲神经网络模型优化方法研究 学位论文 , 2024 作者: 李杨![](/image/person.jpg)
Adobe PDF(7989Kb)  |   收藏  |  浏览/下载:36/2  |  提交时间:2024/06/04 脉冲神经网络优化 人工神经网络-脉冲神经网络转换 时空反向传播 时序高效知识蒸馏 高性能低延迟 |
| 基于目标条件强化学习的无监督技能发现方法研究 学位论文 , 2024 作者: 张天![](/image/person.jpg)
Adobe PDF(13799Kb)  |   收藏  |  浏览/下载:28/1  |  提交时间:2024/05/30 目标 稀疏奖励 无监督强化学习 探索 技能策略 |
| SA-MPF: A Status-Aware Mask Prediction Framework for Online Disease Diagnosis 会议论文 , Yokohama, Japan, 2024-6-30 - 2023-7-5 作者: Zefa Hu ; Linghui Meng ; Yunlong Zhao ; Yuanyuan Zhao ; Shuang Xu ; Bo Xu![](/image/person.jpg)
Adobe PDF(307Kb)  |   收藏  |  浏览/下载:50/11  |  提交时间:2024/05/29 |
| 医疗领域任务型对话系统研究 学位论文 , 2024 作者: 胡泽发![](/image/person.jpg)
Adobe PDF(3935Kb)  |   收藏  |  浏览/下载:61/5  |  提交时间:2024/05/29 医疗对话系统 任务型对话系统 对话理解 对话推理 幻觉现象 |