CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning 会议论文
, 线上, 2022-02-22
作者:  Zhao EM(赵恩民);  Yan RY(闫仁业);  Li JQ(李金秋);  Li K(李凯);  Xing JL(兴军亮)
Adobe PDF(2593Kb)  |  收藏  |  浏览/下载:150/57  |  提交时间:2023/06/29
Distributed Nash equilibrium seeking for integrated game and control of multi-agent systems with input delay 期刊论文
NONLINEAR DYNAMICS, 2021, 卷号: 106, 页码: 583-603
作者:  Ai, Xiaolin
Adobe PDF(3382Kb)  |  收藏  |  浏览/下载:188/35  |  提交时间:2021/11/03
Nash equilibrium seeking  Integrated game and control  Multi-agent systems  Input delay  Input-to-stable stability  
一种针对德州扑克AI的对手建模与策略集成框架 期刊论文
自动化学报, 2021, 期号: 0, 页码: 0
作者:  张蒙;  李凯;  吴哲;  臧一凡;  徐航;  兴军亮
Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:388/109  |  提交时间:2021/06/21
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成  
基于演化学习与对手策略的不完美信息博弈算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  张蒙
Adobe PDF(2515Kb)  |  收藏  |  浏览/下载:366/9  |  提交时间:2021/06/20
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成