CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共8条,第1-8条 帮助

限定条件            
已选(0)清除 条数/页:   排序方式:
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/06/25
强化学习,分层强化学习  
Learning in bi-level markov games 会议论文
, Padua, Italy, 2022.7.18-2022.7.23
作者:  Meng Linghui;  Ruan Jingqing;  Xing Dengpeng;  Xu Bo
Adobe PDF(1450Kb)  |  收藏  |  浏览/下载:18/5  |  提交时间:2024/06/11
M3: Modularization for Multi-task and Multi-agent Offline Pre-training 会议论文
, London, United Kingdom, 2023.5.29-2023.6.2
作者:  Meng Linghui;  Ruan Jingqing;  Xiong Xuantang;  Li Xiyun;  Zhang Xi;  Xing Dengpeng;  Xu Bo
Adobe PDF(1302Kb)  |  收藏  |  浏览/下载:12/3  |  提交时间:2024/06/11
Filtered Observations for Model-Based Multi-agent Reinforcement Learning 会议论文
, Turin, Italy, 2023.9.18-2023.9.22
作者:  Meng Linghui;  Xiong Xuantang;  Zang Yifan;  Zhang Xi;  Li Guoqi;  Xing Dengpeng;  Xu Bo
Adobe PDF(841Kb)  |  收藏  |  浏览/下载:17/8  |  提交时间:2024/06/11
A New Pre-Training Paradigm for Offline Multi-Agent Reinforcement Learning with Suboptimal Data 会议论文
, Seoul, Korea, 2024.4.14-2024.4.19
作者:  Meng Linghui;  Zhang Xi;  Xing Dengpeng;  Xu Bo
Adobe PDF(964Kb)  |  收藏  |  浏览/下载:15/5  |  提交时间:2024/06/11
CHINESE INTONATION ASSESSMENT USING SEV FEATURES 会议论文
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2009
作者:  Ke, DF;  Xu, B
收藏  |  浏览/下载:15/0  |  提交时间:2020/10/27
SUBSPACE CONSTRAINED LU DECOMPOSITION OF FMLLR FOR RAPID ADAPTATION 会议论文
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011
作者:  Jia, L;  Yu, D;  Xu, B
收藏  |  浏览/下载:21/0  |  提交时间:2020/10/27
基于全局词汇信息的中文口语句子标点生成 会议论文
第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集, 贵州贵阳, 5-7
作者:  陈萧;  柯登峰;  徐波
收藏  |  浏览/下载:25/0  |  提交时间:2020/10/27
标点生成  全局信息  词汇信息  模型融合