CASIA OpenIR

浏览/检索结果: 共14条,第1-10条 帮助

限定条件                        
已选(0)清除 条数/页:   排序方式:
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
作者:  张丰一
Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:186/5  |  提交时间:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:287/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
基于新型神经网络与触发机制的机械臂自适应控制研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  高洁
Adobe PDF(12996Kb)  |  收藏  |  浏览/下载:312/8  |  提交时间:2022/06/20
自适应神经网络控制  触发控制  机械臂运动控制  反步法  观测器估计  滤波控制  
融合自适应神经网络的机器人模型预测控制方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  康二龙
Adobe PDF(21541Kb)  |  收藏  |  浏览/下载:294/15  |  提交时间:2022/06/19
机器人控制  模型预测控制  自适应神经网络  机械臂  最优控制理论  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:211/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:194/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈筱语
Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:193/12  |  提交时间:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:310/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴士广
Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:407/25  |  提交时间:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
面向复杂对抗的对手行为预测关键技术研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  siyuan xing
Adobe PDF(2745Kb)  |  收藏  |  浏览/下载:181/10  |  提交时间:2022/06/15
兵棋,位置预测,时空建模,对手建模,异质图网络