CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
A Cooperation Graph Approach for Multiagent Sparse Reward Reinforcement Learning 会议论文
, Padua, Italy, 2022年07月
作者:  Qingxu Fu;  Tenghai Qiu;  Zhiqiang Pu;  Jianqiang Yi;  Wanmai Yuan
Adobe PDF(2650Kb)  |  收藏  |  浏览/下载:43/14  |  提交时间:2024/06/05
MiaoSuan Wargame: A Multi-Mode Integrated Platform for Imperfect Information Game 会议论文
, Beijing, China, August 21-24, 2022
作者:  Jiale Xu;  Jian Hu;  Shixian Wang;  Xuyang Yang;  Wancheng Ni
Adobe PDF(726Kb)  |  收藏  |  浏览/下载:120/37  |  提交时间:2023/06/28
open platform  human-computer gaming  AI evaluation  Turing test  imperfect information game  wargame  
Multi-UAV Cooperative Short-Range Combat via Attention-Based Reinforcement Learning using Individual Reward Shaping 会议论文
, Kyoto, Japan, October 23-27, 2022
作者:  Zhang TL(张天乐);  Qiu TH(丘腾海);  Liu Z(刘振);  Pu ZQ(蒲志强);  Yi JQ(易建强)
Adobe PDF(896Kb)  |  收藏  |  浏览/下载:181/58  |  提交时间:2023/06/12
Real-world learning control for autonomous exploration of a biomimetic robotic shark 期刊论文
IEEE Transactions on Industrial Electronics, 2022, 卷号: 70, 期号: 4, 页码: 3966-3974
作者:  Yan Shuaizheng;  Wu Zhengxing;  Wang Jian;  Huang Yupei;  Tan Min;  Yu Junzhi
Adobe PDF(5981Kb)  |  收藏  |  浏览/下载:179/60  |  提交时间:2023/05/31
D-TNet: Category-Awareness Based Difference-Threshold Alternative Learning Network for Remote Sensing Image Change Detection 期刊论文
IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING, 2022, 卷号: 60, 页码: 1-16
作者:  Wan, Ling;  Tian, Ye;  Kang, Wenchao;  Ma, Lei
Adobe PDF(8963Kb)  |  收藏  |  浏览/下载:150/39  |  提交时间:2023/03/20
Category-awareness  change detection  optical remote sensing image  threshold learning  
一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文
自动化学报, 2022, 页码: 0
作者:  吴哲;  李凯;  徐航;  兴军亮
Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:245/66  |  提交时间:2022/06/17
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:217/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
作者:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:260/53  |  提交时间:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
Adaptive Fusional Localization for Robot Fish Based on Dynamic-weight Fuzzy Inference 会议论文
2021 China Automation Congress (CAC), Beijing, China, 2021-10-22
作者:  Yuzhuo Fu;  Xiaocun Liao;  Ben Lu;  Qianqian Zou;  Zhuoliang Zhang;  Yaming Ou;  Chao Zhou
Adobe PDF(1415Kb)  |  收藏  |  浏览/下载:278/64  |  提交时间:2022/06/14
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
作者:  杨光开
Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:249/7  |  提交时间:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络