CASIA OpenIR

浏览/检索结果: 共22条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
扩展目标跟踪中基于深度强化学习的传感器管理方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431
作者:  张虹芸;  陈辉;  张文旭
Adobe PDF(6523Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/07/25
传感器管理  扩展目标跟踪  深度强化学习  双延迟深度确定性策略梯度  信息增益  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:18/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
类脑心理揣测脉冲神经网络模型研究 学位论文
, 2024
作者:  Zhao,Zhuoya
Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:28/2  |  提交时间:2024/06/04
类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  
基于内在动机的深度强化学习探索策略研究 学位论文
, 2024
作者:  陈忠鹏
Adobe PDF(5803Kb)  |  收藏  |  浏览/下载:29/1  |  提交时间:2024/06/04
深度强化学习,内在动机,探索策略,稀疏奖励  
面向多任务和属性泛化的多智能体强化学习算法研究 学位论文
, 2024
作者:  黄上京
Adobe PDF(15636Kb)  |  收藏  |  浏览/下载:62/3  |  提交时间:2024/06/01
多智能体强化学习  多任务强化学习  多智能体属性组成泛化  实体多机器人平台  
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:53/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:58/1  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
面向平行交通系统的城市交通控制基础模型关键技术 学位论文
, 2024
作者:  赵宸
Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:48/7  |  提交时间:2024/05/27
平行交通系统  交通控制  平行学习  强化学习  基础模型  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放