中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共4条，第1-4条

帮助

已选(0)清除条数/页：排序方式：
	L2E: Learning to Exploit Your Opponent 会议论文 , 意大利帕多瓦, 2022.07.18-2022.07.23 作者: Wu Zhe; Li Kai; Xu Hang; Zang Yifan; An Bo; Xing Junliang Adobe PDF(5676Kb) \| 收藏 \| 浏览/下载：229/45 \| 提交时间：2022/06/17
	基于演化学习与对手策略的不完美信息博弈算法研究学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 张蒙 Adobe PDF(2515Kb) \| 收藏 \| 浏览/下载：374/9 \| 提交时间：2021/06/20 不完美信息博弈德州扑克演化学习在线对手建模种群策略集成
	基于混合更新Q值的深度强化学习方法研究学位论文工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 李主南 Adobe PDF(3839Kb) \| 收藏 \| 浏览/下载：211/5 \| 提交时间：2020/06/10 深度强化学习 Q 学习算法过估计欠估计 Actor-Critic 凸组合混合更新
	Learning Deep Decentralized Policy Network by Collective Rewards for Real-Time Combat Game 会议论文 , Macao, China, August 10-16, 2019 作者: Peixi Peng; Junliang Xing; Lili Cao; Lisen Mu; Chang Huang 浏览 \| Adobe PDF(762Kb) \| 收藏 \| 浏览/下载：356/133 \| 提交时间：2019/10/10 Multi-agent Learning Deep Decentralized Policy Network Real-time Combat Game

中国科学院自动化研究所机构知识库