已选(0)清除
条数/页: 排序方式: |
| 面向兵棋推演的多智能体智能博弈决策算法研究 学位论文 , 2023 作者: 余照科 Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:648/33  |  提交时间:2023/01/31 请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词 |
| 基于深度强化学习的连续动作空中博弈对抗决策 学位论文 , 2023 作者: 李伟凡 Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:347/17  |  提交时间:2023/06/26 强化学习 深度强化学习 自注意力网络 智能决策 多智能体系统 |
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 , 2023 作者: 白云鹏 Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:129/8  |  提交时间:2023/06/13 多智能体,强化学习,超图,变分推断,好奇心 |
| 基于深度强化学习的超车换道决策方法 学位论文 , 2023 作者: 王俊杰 Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:127/2  |  提交时间:2023/06/26 深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化 |
| 基于深度强化学习的群体协同策略方法研究 学位论文 , 2023 作者: 张天乐 Adobe PDF(28114Kb)  |  收藏  |  浏览/下载:133/8  |  提交时间:2023/06/12 群体系统,协同策略,深度强化学习,图注意力网络,内在奖励,课程学习 |
| 执行者-评论家算法框架下的强化学习稳定性研究 学位论文 , 2023 作者: 龚晨 Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:86/6  |  提交时间:2023/06/26 深度强化学习,稳定性,共轭,对抗性攻击,后门攻击 |
| 面向连续控制任务的深度强化学习值函数估计研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强 Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:186/5  |  提交时间:2022/06/17 深度强化学习 值函数估计 值函数表示 集成强化学习 |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 作者: 杨光开 Adobe PDF(17847Kb)  |  收藏  |  浏览/下载:204/7  |  提交时间:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:405/60  |  提交时间:2022/07/12 |
| 基于演示示教的机器人技能模仿学习 学位论文 , 智能化大厦: 中科院自动化所, 2021 作者: 夏鹏程 Adobe PDF(16930Kb)  |  收藏  |  浏览/下载:214/12  |  提交时间:2021/06/18 演示示教 域自适应 轨迹模仿 深度强化学习 |