CASIA OpenIR

浏览/检索结果: 共14条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
自监督机器人操作任务视觉表征学习方法研究 学位论文
, 2024
作者:  马文轩
Adobe PDF(16914Kb)  |  收藏  |  浏览/下载:43/3  |  提交时间:2024/06/04
自监督学习  机器人操作任务学习  视觉表征学习  具身视觉感知  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:196/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
仿豹魴鮄机器人设计与控制策略学习 学位论文
, 2023
作者:  张天栋
Adobe PDF(32276Kb)  |  收藏  |  浏览/下载:233/13  |  提交时间:2023/06/22
仿生水下机器人  人工侧线传感器  控制策略学习  强化学习  课程学习  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
作者:  何强
Adobe PDF(4687Kb)  |  收藏  |  浏览/下载:235/5  |  提交时间:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
基于元学习和强化学习的机器人操作视觉模仿技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李佳怡
Adobe PDF(33715Kb)  |  收藏  |  浏览/下载:241/15  |  提交时间:2022/06/13
机器人操作学习  视觉模仿  元学习  强化学习  
生物启发式肌肉骨骼机器人灵巧结构与控制研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  钟汕林
Adobe PDF(23168Kb)  |  收藏  |  浏览/下载:368/24  |  提交时间:2022/01/19
肌肉骨骼机器人  生物启发式算法  机器人灵巧运动  环境吸引域  
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:682/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文
控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546
作者:  唐振韬;  邵 坤;  赵冬斌;  朱圆恒
Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:294/50  |  提交时间:2021/07/05
深度强化学习  AlphaGo Zero  深度学习  强化学习  人工智能  
基于多智能体强化学习的城市道路交通信号控制 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  刘皓
Adobe PDF(4749Kb)  |  收藏  |  浏览/下载:241/4  |  提交时间:2021/07/02
交通信号控制  强化学习  多智能体  车联网  
基于值分解优化的多智能体深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  王凌霄
Adobe PDF(13415Kb)  |  收藏  |  浏览/下载:216/9  |  提交时间:2021/06/15
深度强化学习  多智能体系统  价值函数分解算法  图神经网络