已选(0)清除
条数/页: 排序方式: |
| 嵌入结构先验的机器人技能学习算法研究 学位论文 , 2022 作者: 张丰一 Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:181/5  |  提交时间:2023/01/12 技能学习 结构先验知识 机器人 状态表示学习 强化学习 |
| 平行交通系统中的预测与控制关键技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 戴星原 Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:282/12  |  提交时间:2022/10/09 平行交通系统 交通预测 交通控制 深度学习 强化学习 |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:301/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 面向跨领域场景的句子匹配关键技术研究 学位论文 工学博士学位, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 白桂荣 Adobe PDF(3950Kb)  |  收藏  |  浏览/下载:222/10  |  提交时间:2022/06/14 自然语言处理,句子匹配,跨领域场景,领域自适应 |
| 基于深度强化学习的群体协同决策方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴士广 Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:396/25  |  提交时间:2022/06/15 群体系统 协同决策 深度强化学习 多智能体强化学习 图注意力网络 |
| 融合自适应神经网络的机器人模型预测控制方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 康二龙 Adobe PDF(21541Kb)  |  收藏  |  浏览/下载:284/15  |  提交时间:2022/06/19 机器人控制 模型预测控制 自适应神经网络 机械臂 最优控制理论 |
| 基于关系网络的多智能体协同分层决策技术 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张朋朋 Adobe PDF(9752Kb)  |  收藏  |  浏览/下载:210/12  |  提交时间:2022/06/13 多智能体协同 关系网络 分层 热力图 可解释性 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:190/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 面向复杂对抗的对手行为预测关键技术研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: siyuan xing Adobe PDF(2745Kb)  |  收藏  |  浏览/下载:173/10  |  提交时间:2022/06/15 兵棋,位置预测,时空建模,对手建模,异质图网络 |
| 基于多智能体强化学习的大规模路网交通信号控制 学位论文 学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈筱语 Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:184/12  |  提交时间:2022/06/16 交通信号控制 马尔科夫决策过程 多智能体强化学习 联邦强化学习 |