CASIA OpenIR

浏览/检索结果: 共362条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
自然语言嵌入的深度强化学习探索方法研究 学位论文
, 2024
作者:  郭洲蕊
Adobe PDF(7588Kb)  |  收藏  |  浏览/下载:17/1  |  提交时间:2024/06/26
深度强化学习  自然语言  探索  
Adaptive Multi-Agent Coordination among Different Team Attribute Tasks via Contextual Meta-Reinforcement Learning 会议论文
, 河南开封, 2024年5月17-19日
作者:  Huang, Shangjing;  Zhao, Zijie;  Zhu, Yuanheng;  Zhao, Dongbin
Adobe PDF(15515Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/06/26
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/06/25
强化学习,分层强化学习  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:7/5  |  提交时间:2024/06/25
User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文
, 新加坡, May 13 - 17, 2024
作者:  Zhang, Zhiyuan;  Zhang, Qichao;  Wu, Xiaoxu;  Shi, Xiaowen;  Liao, Guogang;  Wang, Yongkong;  Wang, xingxing;  Zhao, Dongbin
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:10/5  |  提交时间:2024/06/25
Ads Allocation  Reinforcement Learning  User Response Modeling  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
LEGO: A Multi-agent Collaborative Framework with Role-playing and Iterative Feedback for Causality Explanation Generation 会议论文
, Singapore, 2023-12
作者:  Zhitao He;  Pengfei Cao;  Yubo Chen;  Kang Liu;  Jun Zhao
Adobe PDF(1153Kb)  |  收藏  |  浏览/下载:2/2  |  提交时间:2024/06/25
Enhancing Reinforcement Learning via Transformer-based State Predictive Representations 期刊论文
IEEE Transactions on Artificial Intelligence, 2024, 页码: 1 - 12
作者:  Liu MS(刘民颂);  Zhu YH(朱圆恒);  Chen YR(陈亚冉);  Zhao DB(赵冬斌)
Adobe PDF(1162Kb)  |  收藏  |  浏览/下载:13/3  |  提交时间:2024/06/24
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
Recursive Least-Squares Estimator-Aided Online Learning for Visual Tracking 期刊论文
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2024, 卷号: 46, 期号: 3, 页码: 1881-1897
作者:  Gao, Jin;  Lu, Yan;  Qi, Xiaojuan;  Kou, Yutong;  Li, Bing;  Li, Liang;  Yu, Shan;  Hu, Weiming
Adobe PDF(915Kb)  |  收藏  |  浏览/下载:17/5  |  提交时间:2024/06/21