CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
作者:  张丰一
Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:181/5  |  提交时间:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:282/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:301/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
面向跨领域场景的句子匹配关键技术研究 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  白桂荣
Adobe PDF(3950Kb)  |  收藏  |  浏览/下载:222/10  |  提交时间:2022/06/14
自然语言处理,句子匹配,跨领域场景,领域自适应  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴士广
Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:396/25  |  提交时间:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
融合自适应神经网络的机器人模型预测控制方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  康二龙
Adobe PDF(21541Kb)  |  收藏  |  浏览/下载:284/15  |  提交时间:2022/06/19
机器人控制  模型预测控制  自适应神经网络  机械臂  最优控制理论  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张朋朋
Adobe PDF(9752Kb)  |  收藏  |  浏览/下载:210/12  |  提交时间:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:190/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
面向复杂对抗的对手行为预测关键技术研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  siyuan xing
Adobe PDF(2745Kb)  |  收藏  |  浏览/下载:173/10  |  提交时间:2022/06/15
兵棋,位置预测,时空建模,对手建模,异质图网络  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈筱语
Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:184/12  |  提交时间:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习