已选(0)清除
条数/页: 排序方式: |
| 扩展目标跟踪中基于深度强化学习的传感器管理方法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431 作者: 张虹芸; 陈辉; 张文旭
Adobe PDF(6523Kb)  |   收藏  |  浏览/下载:8/4  |  提交时间:2024/07/25 传感器管理 扩展目标跟踪 深度强化学习 双延迟深度确定性策略梯度 信息增益 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 基于用户行为预测和强化学习的推荐策略研究 学位论文 , 2024 作者: 张志远![](/image/person.jpg)
Adobe PDF(3505Kb)  |   收藏  |  浏览/下载:18/1  |  提交时间:2024/06/25 强化学习 推荐系统 用户行为建模 |
| 类脑心理揣测脉冲神经网络模型研究 学位论文 , 2024 作者: Zhao,Zhuoya![](/image/person.jpg)
Adobe PDF(23946Kb)  |   收藏  |  浏览/下载:28/2  |  提交时间:2024/06/04 类脑心理揣测模型 脉冲神经网络 多智能体社会交互 区分自我和他人 类脑心理揣测模型 脉冲神经网络 多智能体社会交互 区分自我和他人 类脑心理揣测模型 脉冲神经网络 多智能体社会交互 区分自我和他人 |
| 基于内在动机的深度强化学习探索策略研究 学位论文 , 2024 作者: 陈忠鹏![](/image/person.jpg)
Adobe PDF(5803Kb)  |   收藏  |  浏览/下载:29/1  |  提交时间:2024/06/04 深度强化学习,内在动机,探索策略,稀疏奖励 |
| 面向多任务和属性泛化的多智能体强化学习算法研究 学位论文 , 2024 作者: 黄上京![](/image/person.jpg)
Adobe PDF(15636Kb)  |   收藏  |  浏览/下载:62/3  |  提交时间:2024/06/01 多智能体强化学习 多任务强化学习 多智能体属性组成泛化 实体多机器人平台 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:53/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于序列展开模型的多智能体方法研究 学位论文 , 2024 作者: Luo ZX(罗正昕)![](/image/person.jpg)
Adobe PDF(13451Kb)  |   收藏  |  浏览/下载:58/1  |  提交时间:2024/05/30 多智能体 强化学习 序列展开模型 信度分配 非平稳性 |
| 面向平行交通系统的城市交通控制基础模型关键技术 学位论文 , 2024 作者: 赵宸![](/image/person.jpg)
Adobe PDF(6234Kb)  |   收藏  |  浏览/下载:48/7  |  提交时间:2024/05/27 平行交通系统 交通控制 平行学习 强化学习 基础模型 |
| 采用分类经验回放的深度确定性策略梯度方法 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823 作者: 时圣苗; 刘全
Adobe PDF(19798Kb)  |   收藏  |  浏览/下载:7/3  |  提交时间:2024/05/20 连续控制任务 深度确定性策略梯度 经验回放 分类经验回放 |