CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共6条,第1-6条 帮助

限定条件            
已选(0)清除 条数/页:   排序方式:
兵棋推演的智能决策技术与挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:  尹奇跃;  赵美静;  倪晚成;  张俊格;  黄凯奇
Adobe PDF(4513Kb)  |  收藏  |  浏览/下载:6/4  |  提交时间:2024/05/09
兵棋推演  人机对抗  智能决策技术  博弈学习  
AI in Human-computer Gaming: Techniques, Challenges and Opportunities 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 299-317
作者:  Qi-Yue Yin;  Jun Yang;  Kai-Qi Huang;  Mei-Jing Zhao;  Wan-Cheng Ni;  Bin Liang;  Yan Huang;  Shu Wu;  Liang Wang
Adobe PDF(2608Kb)  |  收藏  |  浏览/下载:15/4  |  提交时间:2024/04/23
Human-computer gaming, AI, intelligent decision making, deep reinforcement learning, self-play  
Deep Reinforcement Learning With Part-Aware Exploration Bonus in Video Games 期刊论文
IEEE TRANSACTIONS ON GAMES, 2022, 卷号: 14, 期号: 4, 页码: 644-653
作者:  Xu, Pei;  Yin, Qiyue;  Zhang, Junge;  Huang, Kaiqi
Adobe PDF(1480Kb)  |  收藏  |  浏览/下载:300/74  |  提交时间:2023/02/22
Deep learning  exploration  reinforcement learning  video game  
Offline reinforcement learning with representations for actions 期刊论文
INFORMATION SCIENCES, 2022, 卷号: 610, 页码: 746-758
作者:  Lou, Xingzhou;  Yin, Qiyue;  Zhang, Junge;  Yu, Chao;  He, Zhaofeng;  Cheng, Nengjie;  Huang, Kaiqi
收藏  |  浏览/下载:165/0  |  提交时间:2022/11/14
Offline reinforcement learning  Action embedding  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
作者:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:454/73  |  提交时间:2022/07/12
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
作者:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:220/40  |  提交时间:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作