已选(0)清除
条数/页: 排序方式: |
| 基于强化学习的视觉内容生成 学位论文 , 2024 作者: 秦子涵![](/image/person.jpg)
Adobe PDF(11517Kb)  |   收藏  |  浏览/下载:41/3  |  提交时间:2024/06/26 图像生成 视频生成 强化学习 |
| User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文 , 新加坡, May 13 - 17, 2024 作者: Zhang, Zhiyuan ; Zhang, Qichao ; Wu, Xiaoxu; Shi, Xiaowen; Liao, Guogang; Wang, Yongkong; Wang, xingxing; Zhao, Dongbin![](/image/person.jpg)
Adobe PDF(2077Kb)  |   收藏  |  浏览/下载:52/21  |  提交时间:2024/06/25 Ads Allocation Reinforcement Learning User Response Modeling |
| 基于用户行为预测和强化学习的推荐策略研究 学位论文 , 2024 作者: 张志远![](/image/person.jpg)
Adobe PDF(3505Kb)  |   收藏  |  浏览/下载:27/1  |  提交时间:2024/06/25 强化学习 推荐系统 用户行为建模 |
| TFNet: Multi-Semantic Feature Interaction for CTR Prediction 会议论文 , Virtual Event, China, 2020/07/25-30 作者: Shu Wu ; Feng Yu ; Xueli Yu; Qiang Liu; Liang Wang ; Tieniu Tan ; Jie Shao; Fan Huang
Adobe PDF(1040Kb)  |   收藏  |  浏览/下载:43/17  |  提交时间:2024/06/21 |
| GraphFM: Graph Factorization Machines for Feature Interaction Modeling 期刊论文 Machine Intelligence Research, 2024, 页码: 1 作者: Shu Wu ; Zekun Li ; Yunyue Su; Zeyu Cui ; Xiaoyu Zhang; Liang Wang![](/image/person.jpg)
Adobe PDF(7938Kb)  |   收藏  |  浏览/下载:44/11  |  提交时间:2024/06/21 |
| AG-SDM: Aquascape Generation based on Stable Diffusion Model with Low-Rank Adaptation 期刊论文 Computer Animation and Virtual Worlds, 2024, 卷号: 35, 期号: 3, 页码: 1-15 作者: Zhang MY(张沐阳); Yang JM(杨金明); Xian YW(先越伟); Li W(李巍); Gu JM(谷佳铭); Meng WL(孟维亮) ; Zhang JG(张吉光) ; Zhang XP(张晓鹏)![](/image/person.jpg)
Adobe PDF(8539Kb)  |   收藏  |  浏览/下载:28/13  |  提交时间:2024/06/04 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明![](/image/person.jpg)
Adobe PDF(19731Kb)  |   收藏  |  浏览/下载:58/6  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉![](/image/person.jpg)
Adobe PDF(6367Kb)  |   收藏  |  浏览/下载:70/6  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570 作者: Yan Song; He Jiang ; Zheng Tian; Haifeng Zhang; Yingping Zhang; Jiangcheng Zhu; Zonghong Dai; Weinan Zhang; Jun Wang
Adobe PDF(24588Kb)  |   收藏  |  浏览/下载:65/19  |  提交时间:2024/05/23 Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory |
| Attention Markets of Blockchain-based Decentralized Autonomous Organizations 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1370-1380 作者: Juanjuan Li ; Rui Qin ; Sangtian Guan; Wenwen Ding; Fei Lin; Fei-Yue Wang![](/image/person.jpg)
Adobe PDF(1878Kb)  |   收藏  |  浏览/下载:68/28  |  提交时间:2024/05/22 Attention decentralized autonomous organizations Harberger tax Stackelberg game |