已选(0)清除
条数/页: 排序方式: |
| 基于知识对齐与蒸馏的持续学习方法研究 学位论文 , 2024 作者: 李焜炽![](/image/person.jpg)
Adobe PDF(116614Kb)  |   收藏  |  浏览/下载:34/4  |  提交时间:2024/06/05 持续学习 灾难性遗忘 知识对齐 级联的知识蒸馏框架 一对多信息匹配 |
| 复杂对抗条件下对手意图识别关键技术研究 学位论文 , 2023 作者: 徐佳乐![](/image/person.jpg)
Adobe PDF(3048Kb)  |   收藏  |  浏览/下载:199/10  |  提交时间:2023/06/28 不完美信息博弈 多智能体策略博弈 对手意图识别 知识与数据融合 事件图态势建模 |
| 融合对手建模的多风格策略集成算法研究 学位论文 , 2023 作者: 白丰硕![](/image/person.jpg)
Adobe PDF(5376Kb)  |   收藏  |  浏览/下载:111/5  |  提交时间:2023/06/11 智能博弈对抗 深度强化学习 奖励重塑 多任务强化学习 对手建模 |
| 信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文 , 2023 作者: 赵恩民![](/image/person.jpg)
Adobe PDF(25370Kb)  |   收藏  |  浏览/下载:219/13  |  提交时间:2023/06/08 信息不完备 复杂决策问题 强化学习 单智能体探索 不完美信息博弈 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲![](/image/person.jpg)
Adobe PDF(6758Kb)  |   收藏  |  浏览/下载:202/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 人机对抗中位置估计及其应用 学位论文 , 北京: 中国科学院研究生院, 2018 作者: 潘毅![](/image/person.jpg)
Adobe PDF(3346Kb)  |   收藏  |  浏览/下载:279/4  |  提交时间:2018/05/31 信息素模型 位置估计 决策支持 作战推演 兵棋 |
| 基于强化学习的城市交通信号优化控制 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2010 作者: 张震
Adobe PDF(12129Kb)  |   收藏  |  浏览/下载:306/0  |  提交时间:2015/09/02 强化学习 交通信号控制 多agent系统 基于基团分解 因子图 一般最大和算法 Reinforcement Learning Traffic Signal Control Multiagent Systems Clique-based Decomposition Factor Graphs The General Max-plus Algorithm |