已选(0)清除
条数/页: 排序方式: |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:11/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| 基于基础模型的分层强化学习 学位论文 , 2024 作者: 吴俣桥![](/image/person.jpg)
Adobe PDF(16716Kb)  |   收藏  |  浏览/下载:24/0  |  提交时间:2024/06/21 强化学习 分层强化学习 基础模型 |
| 基于知识对齐与蒸馏的持续学习方法研究 学位论文 , 2024 作者: 李焜炽![](/image/person.jpg)
Adobe PDF(116614Kb)  |   收藏  |  浏览/下载:53/9  |  提交时间:2024/06/05 持续学习 灾难性遗忘 知识对齐 级联的知识蒸馏框架 一对多信息匹配 |
| 基于脑脉冲序列的离散时间动态系统学习控制研究 学位论文 , 2024 作者: 韩立元![](/image/person.jpg)
Adobe PDF(32282Kb)  |   收藏  |  浏览/下载:25/4  |  提交时间:2024/06/04 离散时间动态系统 脑脉冲序列 脉冲自适应动态规划 脉冲神经网络 多尺度动力学 脑机接口 |
| 基于机理建模和数据驱动的机器人装配技能学习研究 学位论文 , 2024 作者: 严少华![](/image/person.jpg)
Adobe PDF(6690Kb)  |   收藏  |  浏览/下载:41/5  |  提交时间:2024/05/29 位姿测量 对准控制 强化学习 装入控制 装配技能学习 |
| 受脑启发的多任务域小样本连续学习方法研究 学位论文 , 2023 作者: 商迪![](/image/person.jpg)
Adobe PDF(1921Kb)  |   收藏  |  浏览/下载:196/7  |  提交时间:2023/08/31 连续学习,小样本学习,多任务域学习,类脑计算,目标检测 |
| 融合层级目标关系图的开放环境语义目标导航研究 学位论文 , 2023 作者: 许涛![](/image/person.jpg)
Adobe PDF(8787Kb)  |   收藏  |  浏览/下载:94/5  |  提交时间:2023/06/25 语义目标导航 层级目标关系图 具身智能 经验重放 |
| 基于深度强化学习的网约车调度算法研究 学位论文 , 2023 作者: 习金浩![](/image/person.jpg)
Adobe PDF(15643Kb)  |   收藏  |  浏览/下载:138/8  |  提交时间:2023/06/08 Vehicle Repositioning Deep Reinforcement Learning Hierarchical Reinforcement Learning Graph Neural Network |
| 面向图像识别与物体检测的连续学习研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 崔波![](/image/person.jpg)
Adobe PDF(25344Kb)  |   收藏  |  浏览/下载:250/0  |  提交时间:2022/06/28 连续学习 深度学习 图像识别 物体检测 |
| 面向连续控制任务的深度强化学习值函数估计研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强![](/image/person.jpg)
Adobe PDF(4687Kb)  |   收藏  |  浏览/下载:223/5  |  提交时间:2022/06/17 深度强化学习 值函数估计 值函数表示 集成强化学习 |