CASIA OpenIR

浏览/检索结果: 共7条,第1-7条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
A Cooperation Graph Approach for Multiagent Sparse Reward Reinforcement Learning 会议论文
, Padua, Italy, 2022年07月
作者:  Qingxu Fu;  Tenghai Qiu;  Zhiqiang Pu;  Jianqiang Yi;  Wanmai Yuan
Adobe PDF(2650Kb)  |  收藏  |  浏览/下载:38/12  |  提交时间:2024/06/05
Empirical Policy Optimization for n-Player Markov Games 期刊论文
IEEE Transactions on Cybernetics, 2022, 页码: doi={10.1109/TCYB.2022.3179775}
作者:  Yuanheng Zhu;  Weifan Li;  Mengchen Zhao;  Jianye Hao;  Dongbin Zhao
Adobe PDF(1739Kb)  |  收藏  |  浏览/下载:111/44  |  提交时间:2023/04/26
知识与数据协同驱动的异质图像表示与合成 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  骆曼迪
Adobe PDF(10423Kb)  |  收藏  |  浏览/下载:337/15  |  提交时间:2022/08/08
知识与数据协同驱动  异质图像表示  异质图像合成  异质图像转换  生成对抗网络  信息瓶颈  
基于异质图像知识的视觉感知方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  严岚
Adobe PDF(13252Kb)  |  收藏  |  浏览/下载:249/11  |  提交时间:2022/06/23
异质图像  计算机视觉  深度学习  生成对抗网络  
基于关系网络的多智能体协同分层决策技术 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张朋朋
Adobe PDF(9752Kb)  |  收藏  |  浏览/下载:236/12  |  提交时间:2022/06/13
多智能体协同  关系网络  分层  热力图  可解释性  
基于深度强化学习的扁平类物体预抓取操作的研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴家汐
Adobe PDF(26650Kb)  |  收藏  |  浏览/下载:215/10  |  提交时间:2022/06/13
预抓取操作  深度强化学习  课程学习  
Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241
作者:  Zhu, Yuanheng;  Zhao, Dongbin
Adobe PDF(2838Kb)  |  收藏  |  浏览/下载:249/12  |  提交时间:2022/06/10
Games  Nash equilibrium  Mathematical model  Markov processes  Convergence  Dynamic programming  Training  Deep reinforcement learning (DRL)  generalized policy iteration (GPI)  Markov game (MG)  Nash equilibrium  Q network  zero sum