CASIA OpenIR

浏览/检索结果: 共13条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:98/3  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏  
基于深度强化学习的群体协同策略方法研究 学位论文
, 2023
作者:  张天乐
Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:168/11  |  提交时间:2023/06/12
群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  戴星原
Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:283/12  |  提交时间:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
基于多智能体强化学习的大规模路网交通信号控制 学位论文
学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈筱语
Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:188/12  |  提交时间:2022/06/16
交通信号控制  马尔科夫决策过程  多智能体强化学习  联邦强化学习  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:305/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴士广
Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:399/25  |  提交时间:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:280/67  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能  
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:621/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  郭龙腾
Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:311/20  |  提交时间:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码