CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:231/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈筱语
Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:227/13  |  提交时间:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习  
面向速度滑冰的智能分析及决策技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  杨威
Adobe PDF(4891Kb)  |  收藏  |  浏览/下载:215/2  |  提交时间:2022/06/13
速度滑冰  智能分析  深度强化学习  战术决策  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张朋朋
Adobe PDF(9752Kb)  |  收藏  |  浏览/下载:237/12  |  提交时间:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性