已选(0)清除
条数/页: 排序方式: |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅![](/image/person.jpg)
Adobe PDF(11380Kb)  |   收藏  |  浏览/下载:46/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:39/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 基于视觉表征的深度强化学习方法 学位论文 , 2024 作者: 刘民颂![](/image/person.jpg)
Adobe PDF(10778Kb)  |   收藏  |  浏览/下载:46/4  |  提交时间:2024/06/22 深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥![](/image/person.jpg)
Adobe PDF(16716Kb)  |   收藏  |  浏览/下载:39/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| 基于预训练模型的决策序列化建模研究 学位论文 , 2024 作者: 林润基![](/image/person.jpg)
Adobe PDF(7811Kb)  |   收藏  |  浏览/下载:69/1  |  提交时间:2024/06/07 预训练模型 决策序列化 序列模型 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:53/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 , 2024 作者: 付清旭![](/image/person.jpg)
Adobe PDF(39071Kb)  |   收藏  |  浏览/下载:60/6  |  提交时间:2024/05/29 大规模,群体系统,协同,决策,深度强化学习,多智能体系统 |
| 医疗领域任务型对话系统研究 学位论文 , 2024 作者: 胡泽发![](/image/person.jpg)
Adobe PDF(3935Kb)  |   收藏  |  浏览/下载:73/5  |  提交时间:2024/05/29 医疗对话系统 任务型对话系统 对话理解 对话推理 幻觉现象 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明![](/image/person.jpg)
Adobe PDF(19731Kb)  |   收藏  |  浏览/下载:47/5  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |