CASIA OpenIR

浏览/检索结果: 共38条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:81/2  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:139/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:366/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
基于深度强化学习的群体协同策略方法研究 学位论文
, 2023
作者:  张天乐
Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:147/9  |  提交时间:2023/06/12
群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习  
信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文
, 2023
作者:  赵恩民
Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:177/10  |  提交时间:2023/06/08
信息不完备  复杂决策问题  强化学习  单智能体探索  不完美信息博弈  
仿生机器双髻鲨的水下环境感知与自主导航研究 学位论文
, 2023
作者:  闫帅铮
Adobe PDF(42821Kb)  |  收藏  |  浏览/下载:180/21  |  提交时间:2023/06/07
仿生机器双髻鲨  水下图像质量复原  深度强化学习  自主避障  视觉导航  
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
作者:  张丰一
Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:172/5  |  提交时间:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:269/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
基于平行学习的混合智能调控方法与应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李小双
Adobe PDF(10128Kb)  |  收藏  |  浏览/下载:195/12  |  提交时间:2022/06/20
平行学习  混合智能调控  示教数据  模仿学习  深度强化学习  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:194/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习