已选(0)清除
条数/页: 排序方式: |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 基于用户行为预测和强化学习的推荐策略研究 学位论文 , 2024 作者: 张志远![](/image/person.jpg)
Adobe PDF(3505Kb)  |   收藏  |  浏览/下载:17/1  |  提交时间:2024/06/25 强化学习 推荐系统 用户行为建模 |
| 基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文 , 2024 作者: 王筱琦![](/image/person.jpg)
Adobe PDF(2737Kb)  |   收藏  |  浏览/下载:54/1  |  提交时间:2024/06/06 兵棋推演 模仿学习 强化学习 人机对抗 |
| 基于深度学习的群组推荐方法研究综述 期刊论文 自动化学报, 2024, 页码: 1-22 作者: 郑楠 ; 章颂 ; 刘玉桥 ; 王雨桐 ; 王飞跃![](/image/person.jpg)
Adobe PDF(1984Kb)  |   收藏  |  浏览/下载:101/52  |  提交时间:2024/06/03 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:51/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 面向知识图谱补全的小样本学习方法研究 学位论文 , 2024 作者: 李金林![](/image/person.jpg)
Adobe PDF(1855Kb)  |   收藏  |  浏览/下载:63/3  |  提交时间:2024/05/29 小样本学习 知识图谱补全 交互学习 预训练语言模型 大语言模型 |
| 管道式任务型对话系统关键技术研究 学位论文 , 2024 作者: 邱俊彦![](/image/person.jpg)
Adobe PDF(5583Kb)  |   收藏  |  浏览/下载:29/4  |  提交时间:2024/05/27 任务型对话系统 对话状态跟踪 对话策略 自然语言生成 |