CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
二人零和动态博弈的自学习平行控制方法研究 学位论文
, 2023
作者:  朱振华
Adobe PDF(1737Kb)  |  收藏  |  浏览/下载:174/6  |  提交时间:2023/12/15
自适应动态规划  平行控制  零和博弈  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:191/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于自适应动态规划的最优跟踪控制方法研究 学位论文
, 2023
作者:  王鑫
Adobe PDF(6647Kb)  |  收藏  |  浏览/下载:193/11  |  提交时间:2023/06/08
自适应动态规划  输出调节  追逃博弈  最优控制  一致性控制  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:229/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
基于自适应动态规划的分布式迭代控制方法研究 学位论文
工学博士, 人工智能学院: 中国科学院大学, 2022
作者:  李洪阳
Adobe PDF(3786Kb)  |  收藏  |  浏览/下载:312/26  |  提交时间:2022/06/14
自适应动态规划,最优控制,分布式控制,智能控制,强化学习  
定量降水机器学习模型与方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2021
作者:  吴雅婧
Adobe PDF(11694Kb)  |  收藏  |  浏览/下载:424/78  |  提交时间:2021/06/18
机器学习  定量降水估计  定量降水预报  深度图神经网络  时空图卷 积网络  
面向数字图像的对抗攻击与防御算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2021
作者:  王雨桐
Adobe PDF(8781Kb)  |  收藏  |  浏览/下载:320/16  |  提交时间:2021/06/15
对抗样本  对抗攻击  防御  对抗训练  神经网络  
基于值分解优化的多智能体深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  王凌霄
Adobe PDF(13415Kb)  |  收藏  |  浏览/下载:214/9  |  提交时间:2021/06/15
深度强化学习  多智能体系统  价值函数分解算法  图神经网络  
面向非平稳环境的知识迁移方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李怀宇
Adobe PDF(13633Kb)  |  收藏  |  浏览/下载:268/10  |  提交时间:2020/06/11
元学习  持续学习  知识迁移  灾难遗忘  生成式对抗网络  
面向智能驾驶视觉控制的深度强化学习方法 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2019
作者:  李栋
Adobe PDF(6681Kb)  |  收藏  |  浏览/下载:352/11  |  提交时间:2019/06/27
深度强化学习  智能驾驶  视觉控制  目标检测  图注意力网络