CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文
, 2023
作者:  赵恩民
Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:181/10  |  提交时间:2023/06/08
信息不完备  复杂决策问题  强化学习  单智能体探索  不完美信息博弈  
复杂对抗条件下对手意图识别关键技术研究 学位论文
, 2023
作者:  徐佳乐
Adobe PDF(3048Kb)  |  收藏  |  浏览/下载:158/9  |  提交时间:2023/06/28
不完美信息博弈  多智能体策略博弈  对手意图识别  知识与数据融合  事件图态势建模  
融合对手建模的多风格策略集成算法研究 学位论文
, 2023
作者:  白丰硕
Adobe PDF(5376Kb)  |  收藏  |  浏览/下载:97/5  |  提交时间:2023/06/11
智能博弈对抗  深度强化学习  奖励重塑  多任务强化学习  对手建模  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:185/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
人机对抗中位置估计及其应用 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  潘毅
Adobe PDF(3346Kb)  |  收藏  |  浏览/下载:260/4  |  提交时间:2018/05/31
信息素模型  位置估计  决策支持  作战推演  兵棋  
基于强化学习的城市交通信号优化控制 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2010
作者:  张震
Adobe PDF(12129Kb)  |  收藏  |  浏览/下载:295/0  |  提交时间:2015/09/02
强化学习  交通信号控制  多agent系统  基于基团分解  因子图  一般最大和算法  Reinforcement Learning  Traffic Signal Control  Multiagent Systems  Clique-based Decomposition  Factor Graphs  The General Max-plus Algorithm