CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:24/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
基于知识对齐与蒸馏的持续学习方法研究 学位论文
, 2024
作者:  李焜炽
Adobe PDF(116614Kb)  |  收藏  |  浏览/下载:53/9  |  提交时间:2024/06/05
持续学习  灾难性遗忘  知识对齐  级联的知识蒸馏框架  一对多信息匹配  
基于脑脉冲序列的离散时间动态系统学习控制研究 学位论文
, 2024
作者:  韩立元
Adobe PDF(32282Kb)  |  收藏  |  浏览/下载:25/4  |  提交时间:2024/06/04
离散时间动态系统  脑脉冲序列  脉冲自适应动态规划  脉冲神经网络  多尺度动力学  脑机接口  
基于机理建模和数据驱动的机器人装配技能学习研究 学位论文
, 2024
作者:  严少华
Adobe PDF(6690Kb)  |  收藏  |  浏览/下载:41/5  |  提交时间:2024/05/29
位姿测量  对准控制  强化学习  装入控制  装配技能学习  
受脑启发的多任务域小样本连续学习方法研究 学位论文
, 2023
作者:  商迪
Adobe PDF(1921Kb)  |  收藏  |  浏览/下载:196/7  |  提交时间:2023/08/31
连续学习,小样本学习,多任务域学习,类脑计算,目标检测  
融合层级目标关系图的开放环境语义目标导航研究 学位论文
, 2023
作者:  许涛
Adobe PDF(8787Kb)  |  收藏  |  浏览/下载:94/5  |  提交时间:2023/06/25
语义目标导航  层级目标关系图  具身智能  经验重放  
基于深度强化学习的网约车调度算法研究 学位论文
, 2023
作者:  习金浩
Adobe PDF(15643Kb)  |  收藏  |  浏览/下载:138/8  |  提交时间:2023/06/08
Vehicle Repositioning  Deep Reinforcement Learning  Hierarchical Reinforcement Learning  Graph Neural Network  
面向图像识别与物体检测的连续学习研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  崔波
Adobe PDF(25344Kb)  |  收藏  |  浏览/下载:250/0  |  提交时间:2022/06/28
连续学习  深度学习  图像识别  物体检测  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:223/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习