已选(0)清除
条数/页: 排序方式: |
| 嵌入结构先验的机器人技能学习算法研究 学位论文 , 2022 作者: 张丰一 Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:186/5  |  提交时间:2023/01/12 技能学习 结构先验知识 机器人 状态表示学习 强化学习 |
| 平行交通系统中的预测与控制关键技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 戴星原 Adobe PDF(14868Kb)  |  收藏  |  浏览/下载:287/12  |  提交时间:2022/10/09 平行交通系统 交通预测 交通控制 深度学习 强化学习 |
| 基于新型神经网络与触发机制的机械臂自适应控制研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 高洁 Adobe PDF(12996Kb)  |  收藏  |  浏览/下载:312/8  |  提交时间:2022/06/20 自适应神经网络控制 触发控制 机械臂运动控制 反步法 观测器估计 滤波控制 |
| 融合自适应神经网络的机器人模型预测控制方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 康二龙 Adobe PDF(21541Kb)  |  收藏  |  浏览/下载:294/15  |  提交时间:2022/06/19 机器人控制 模型预测控制 自适应神经网络 机械臂 最优控制理论 |
| 面向连续控制任务的深度强化学习值函数估计研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强 Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:211/5  |  提交时间:2022/06/17 深度强化学习 值函数估计 值函数表示 集成强化学习 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:194/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 基于多智能体强化学习的大规模路网交通信号控制 学位论文 学术硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈筱语 Adobe PDF(23947Kb)  |  收藏  |  浏览/下载:193/12  |  提交时间:2022/06/16 交通信号控制 马尔科夫决策过程 多智能体强化学习 联邦强化学习 |
| 对抗场景中的智能体策略泛化研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:310/14  |  提交时间:2022/06/16 深度强化学习 多智能体 策略泛化 Ad-Hoc 协作 信用分配 |
| 基于深度强化学习的群体协同决策方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴士广 Adobe PDF(14260Kb)  |  收藏  |  浏览/下载:407/25  |  提交时间:2022/06/15 群体系统 协同决策 深度强化学习 多智能体强化学习 图注意力网络 |
| 面向复杂对抗的对手行为预测关键技术研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: siyuan xing Adobe PDF(2745Kb)  |  收藏  |  浏览/下载:181/10  |  提交时间:2022/06/15 兵棋,位置预测,时空建模,对手建模,异质图网络 |