CASIA OpenIR

浏览/检索结果: 共200条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于强化学习的视觉内容生成 学位论文
, 2024
作者:  秦子涵
Adobe PDF(11517Kb)  |  收藏  |  浏览/下载:41/3  |  提交时间:2024/06/26
图像生成  视频生成  强化学习  
User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文
, 新加坡, May 13 - 17, 2024
作者:  Zhang, Zhiyuan;  Zhang, Qichao;  Wu, Xiaoxu;  Shi, Xiaowen;  Liao, Guogang;  Wang, Yongkong;  Wang, xingxing;  Zhao, Dongbin
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:52/21  |  提交时间:2024/06/25
Ads Allocation  Reinforcement Learning  User Response Modeling  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:27/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
TFNet: Multi-Semantic Feature Interaction for CTR Prediction 会议论文
, Virtual Event, China, 2020/07/25-30
作者:  Shu Wu;  Feng Yu;  Xueli Yu;  Qiang Liu;  Liang Wang;  Tieniu Tan;  Jie Shao;  Fan Huang
Adobe PDF(1040Kb)  |  收藏  |  浏览/下载:43/17  |  提交时间:2024/06/21
GraphFM: Graph Factorization Machines for Feature Interaction Modeling 期刊论文
Machine Intelligence Research, 2024, 页码: 1
作者:  Shu Wu;  Zekun Li;  Yunyue Su;  Zeyu Cui;  Xiaoyu Zhang;  Liang Wang
Adobe PDF(7938Kb)  |  收藏  |  浏览/下载:44/11  |  提交时间:2024/06/21
AG-SDM: Aquascape Generation based on Stable Diffusion Model with Low-Rank Adaptation 期刊论文
Computer Animation and Virtual Worlds, 2024, 卷号: 35, 期号: 3, 页码: 1-15
作者:  Zhang MY(张沐阳);  Yang JM(杨金明);  Xian YW(先越伟);  Li W(李巍);  Gu JM(谷佳铭);  Meng WL(孟维亮);  Zhang JG(张吉光);  Zhang XP(张晓鹏)
Adobe PDF(8539Kb)  |  收藏  |  浏览/下载:28/13  |  提交时间:2024/06/04
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:58/6  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:70/6  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:65/19  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Attention Markets of Blockchain-based Decentralized Autonomous Organizations 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1370-1380
作者:  Juanjuan Li;  Rui Qin;  Sangtian Guan;  Wenwen Ding;  Fei Lin;  Fei-Yue Wang
Adobe PDF(1878Kb)  |  收藏  |  浏览/下载:68/28  |  提交时间:2024/05/22
Attention  decentralized autonomous organizations  Harberger tax  Stackelberg game