CASIA OpenIR

浏览/检索结果: 共768条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning State-Specific Action Masks for Reinforcement Learning 期刊论文
Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60
作者:  Wang ZY(王梓薏);  Li XR(李欣然);  Sun LY(孙罗洋);  Zhang HF(张海峰);  Liu HL(刘华林);  Jun Wang
Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/07/05
reinforcement learning  exploration efficiency  space reduction  
Radiomic signatures associated with tumor immune heterogeneity predict survival in locally recurrent nasopharyngeal carcinoma 期刊论文
JNCI-JOURNAL OF THE NATIONAL CANCER INSTITUTE, 2024, 页码: 10
作者:  Lin, Da-Feng;  Li, Hai-Lin;  Liu, Ting;  Lv, Xiao-Fei;  Xie, Chuan-Miao;  Ou, Xiao-Min;  Guan, Jian;  Zhang, Ye;  Yan, Wen-Bin;  He, Mei-Lin;  Mao, Meng-Yuan;  Zhao, Xun;  Zhong, Lian-Zhen;  Chen, Wen-Hui;  Chen, Qiu-Yan;  Mai, Hai-Qiang;  Peng, Rou-Jun;  Tian, Jie;  Tang, Lin-Quan;  Dong, Di
收藏  |  浏览/下载:6/0  |  提交时间:2024/07/04
Dynamic datasets and market environments for financial reinforcement learning 期刊论文
MACHINE LEARNING, 2024, 页码: 45
作者:  Liu, Xiao-Yang;  Xia, Ziyi;  Yang, Hongyang;  Gao, Jiechao;  Zha, Daochen;  Zhu, Ming;  Wang, Christina Dan;  Wang, Zhaoran;  Guo, Jian
收藏  |  浏览/下载:1/0  |  提交时间:2024/07/03
Financial reinforcement learning  FinRL  Dynamic dataset  Market environment  AI4Finance  Open finance  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
动态资讯 2021年 第07期(总第87期) 其他
2021-07-01
作者:  张桂英
Adobe PDF(16033Kb)  |  收藏  |  浏览/下载:13/4  |  提交时间:2024/07/01
Humor Detection System for MuSE 2023: Contextual Modeling, Pseudo Labelling, and Post-smoothing 会议论文
, 加拿大多伦多, 2023-11
作者:  Xu MY(徐名宇);  Chen S(陈顺);  Lian Z(连政);  Liu B(刘斌)
Adobe PDF(557Kb)  |  收藏  |  浏览/下载:16/8  |  提交时间:2024/06/27
User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文
, 新加坡, May 13 - 17, 2024
作者:  Zhang, Zhiyuan;  Zhang, Qichao;  Wu, Xiaoxu;  Shi, Xiaowen;  Liao, Guogang;  Wang, Yongkong;  Wang, xingxing;  Zhao, Dongbin
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:21/8  |  提交时间:2024/06/25
Ads Allocation  Reinforcement Learning  User Response Modeling  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:12/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
交互场景下多模态抑郁程度评估与可解释性研究 学位论文
, 2023
作者:  蔡聪
Adobe PDF(5243Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/06/25
抑郁程度评估  多模态  交互场景  机器学习  可解释性  
TFNet: Multi-Semantic Feature Interaction for CTR Prediction 会议论文
, Virtual Event, China, 2020/07/25-30
作者:  Shu Wu;  Feng Yu;  Xueli Yu;  Qiang Liu;  Liang Wang;  Tieniu Tan;  Jie Shao;  Fan Huang
Adobe PDF(1040Kb)  |  收藏  |  浏览/下载:23/8  |  提交时间:2024/06/21