已选(0)清除
条数/页: 排序方式: |
| A Cooperation Graph Approach for Multiagent Sparse Reward Reinforcement Learning 会议论文 , Padua, Italy, 2022年07月 作者: Qingxu Fu ; Tenghai Qiu ; Zhiqiang Pu ; Jianqiang Yi ; Wanmai Yuan
Adobe PDF(2650Kb)  |   收藏  |  浏览/下载:40/12  |  提交时间:2024/06/05 |
| Empirical Policy Optimization for n-Player Markov Games 期刊论文 IEEE Transactions on Cybernetics, 2022, 页码: doi={10.1109/TCYB.2022.3179775} 作者: Yuanheng Zhu ; Weifan Li ; Mengchen Zhao; Jianye Hao; Dongbin Zhao![](/image/person.jpg)
Adobe PDF(1739Kb)  |   收藏  |  浏览/下载:111/44  |  提交时间:2023/04/26 |
| 知识与数据协同驱动的异质图像表示与合成 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 骆曼迪![](/image/person.jpg)
Adobe PDF(10423Kb)  |   收藏  |  浏览/下载:338/15  |  提交时间:2022/08/08 知识与数据协同驱动 异质图像表示 异质图像合成 异质图像转换 生成对抗网络 信息瓶颈 |
| 基于异质图像知识的视觉感知方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 严岚![](/image/person.jpg)
Adobe PDF(13252Kb)  |   收藏  |  浏览/下载:250/11  |  提交时间:2022/06/23 异质图像 计算机视觉 深度学习 生成对抗网络 |
| 基于关系网络的多智能体协同分层决策技术 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张朋朋![](/image/person.jpg)
Adobe PDF(9752Kb)  |   收藏  |  浏览/下载:237/12  |  提交时间:2022/06/13 多智能体协同 关系网络 分层 热力图 可解释性 |
| 基于深度强化学习的扁平类物体预抓取操作的研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴家汐![](/image/person.jpg)
Adobe PDF(26650Kb)  |   收藏  |  浏览/下载:215/10  |  提交时间:2022/06/13 预抓取操作 深度强化学习 课程学习 |
| Online Minimax Q Network Learning for Two-Player Zero-Sum Markov Games 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 卷号: 33, 期号: 3, 页码: 1228-1241 作者: Zhu, Yuanheng ; Zhao, Dongbin![](/image/person.jpg)
Adobe PDF(2838Kb)  |   收藏  |  浏览/下载:250/12  |  提交时间:2022/06/10 Games Nash equilibrium Mathematical model Markov processes Convergence Dynamic programming Training Deep reinforcement learning (DRL) generalized policy iteration (GPI) Markov game (MG) Nash equilibrium Q network zero sum |