CASIA OpenIR

浏览/检索结果: 共13条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:52/13  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:153/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:396/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
执行者-评论家算法框架下的强化学习稳定性研究 学位论文
, 2023
作者:  龚晨
Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:96/6  |  提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击  
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
, 2023
作者:  白云鹏
Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:153/9  |  提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心  
基于自适应动态规划的最优跟踪控制方法研究 学位论文
, 2023
作者:  王鑫
Adobe PDF(6647Kb)  |  收藏  |  浏览/下载:163/10  |  提交时间:2023/06/08
自适应动态规划  输出调节  追逃博弈  最优控制  一致性控制  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:282/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
基于平行学习的混合智能调控方法与应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李小双
Adobe PDF(10128Kb)  |  收藏  |  浏览/下载:202/13  |  提交时间:2022/06/20
平行学习  混合智能调控  示教数据  模仿学习  深度强化学习