CASIA OpenIR

浏览/检索结果: 共33条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文
, Nanjing, 2023-11-27
作者:  Yuqiao Wu;  Haifeng Zhang;  Jun Wang
Adobe PDF(1339Kb)  |  收藏  |  浏览/下载:9/1  |  提交时间:2024/07/12
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/06/25
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:32/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
Learning in bi-level markov games 会议论文
, Padua, Italy, 2022.7.18-2022.7.23
作者:  Meng Linghui;  Ruan Jingqing;  Xing Dengpeng;  Xu Bo
Adobe PDF(1450Kb)  |  收藏  |  浏览/下载:35/12  |  提交时间:2024/06/11
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:73/7  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
类脑脉冲神经网络模型优化方法研究 学位论文
, 2024
作者:  李杨
Adobe PDF(7989Kb)  |  收藏  |  浏览/下载:36/2  |  提交时间:2024/06/04
脉冲神经网络优化  人工神经网络-脉冲神经网络转换  时空反向传播  时序高效知识蒸馏  高性能低延迟  
基于目标条件强化学习的无监督技能发现方法研究 学位论文
, 2024
作者:  张天
Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:28/1  |  提交时间:2024/05/30
目标  稀疏奖励  无监督强化学习  探索  技能策略  
SA-MPF: A Status-Aware Mask Prediction Framework for Online Disease Diagnosis 会议论文
, Yokohama, Japan, 2024-6-30 - 2023-7-5
作者:  Zefa Hu;  Linghui Meng;  Yunlong Zhao;  Yuanyuan Zhao;  Shuang Xu;  Bo Xu
Adobe PDF(307Kb)  |  收藏  |  浏览/下载:50/11  |  提交时间:2024/05/29
医疗领域任务型对话系统研究 学位论文
, 2024
作者:  胡泽发
Adobe PDF(3935Kb)  |  收藏  |  浏览/下载:61/5  |  提交时间:2024/05/29
医疗对话系统  任务型对话系统  对话理解  对话推理  幻觉现象