已选(0)清除
条数/页: 排序方式: |
| 面向多智能体协作的注意力意图与交流学习方法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325 作者: 俞文武; 杨晓亚; 李海昌; 王瑞; 胡晓惠 Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:17/9  |  提交时间:2024/04/18 多智能体 强化学习 意图交流 注意力机制 |
| 全局信息指导下的分布式多智能体协作算法研究 学位论文 , 2023 作者: 陈逸群 Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:86/2  |  提交时间:2023/06/27 强化学习,多智能体协作,全局信息,知识蒸馏 |
| 基于深度强化学习的超车换道决策方法 学位论文 , 2023 作者: 王俊杰 Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:148/3  |  提交时间:2023/06/26 深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化 |
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 , 2023 作者: 白云鹏 Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:152/9  |  提交时间:2023/06/13 多智能体,强化学习,超图,变分推断,好奇心 |
| 基于深度强化学习的群体协同策略方法研究 学位论文 , 2023 作者: 张天乐 Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:159/9  |  提交时间:2023/06/12 群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:431/68  |  提交时间:2022/07/12 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:187/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:213/37  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:294/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 基于深度强化学习的群体协同决策方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴士广 Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:384/24  |  提交时间:2022/06/15 群体系统 协同决策 深度强化学习 多智能体强化学习 图注意力网络 |