CASIA OpenIR

浏览/检索结果: 共199条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文
, 新加坡, May 13 - 17, 2024
作者:  Zhang, Zhiyuan;  Zhang, Qichao;  Wu, Xiaoxu;  Shi, Xiaowen;  Liao, Guogang;  Wang, Yongkong;  Wang, xingxing;  Zhao, Dongbin
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:52/21  |  提交时间:2024/06/25
Ads Allocation  Reinforcement Learning  User Response Modeling  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:26/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
GraphFM: Graph Factorization Machines for Feature Interaction Modeling 期刊论文
Machine Intelligence Research, 2024, 页码: 1
作者:  Shu Wu;  Zekun Li;  Yunyue Su;  Zeyu Cui;  Xiaoyu Zhang;  Liang Wang
Adobe PDF(7938Kb)  |  收藏  |  浏览/下载:44/11  |  提交时间:2024/06/21
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:59/1  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:58/6  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:70/6  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:65/19  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Ripple Knowledge Graph Convolutional Networks for Recommendation Systems 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 481-494
作者:  Chen Li;  Yang Cao;  Ye Zhu;  Debo Cheng;  Chengyuan Li;  Yasuhiko Morimoto
Adobe PDF(3688Kb)  |  收藏  |  浏览/下载:64/27  |  提交时间:2024/05/23
Deep learning, recommendation systems, knowledge graph, graph convolutional networks (GCNs), graph neural networks (GNNs)  
Attention Markets of Blockchain-based Decentralized Autonomous Organizations 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1370-1380
作者:  Juanjuan Li;  Rui Qin;  Sangtian Guan;  Wenwen Ding;  Fei Lin;  Fei-Yue Wang
Adobe PDF(1878Kb)  |  收藏  |  浏览/下载:68/28  |  提交时间:2024/05/22
Attention  decentralized autonomous organizations  Harberger tax  Stackelberg game  
基于隐私保护的联邦推荐算法综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2142-2163
作者:  张洪磊;  李浥东;  邬俊;  陈乃月;  董海荣
Adobe PDF(2697Kb)  |  收藏  |  浏览/下载:70/26  |  提交时间:2024/05/20
推荐系统  联邦学习  隐私保护  协同过滤