CASIA OpenIR

Browse/Search Results:  1-10 of 18 Help

Selected(0)Clear Items/Page:    Sort:
对抗环境中基于值分解框架的多智能体协同算法研究 学位论文
工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022
Authors:  杨光开
Adobe PDF(17847Kb)  |  Favorite  |  View/Download:38/2  |  Submit date:2022/06/13
多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络  
面向连续控制任务的深度强化学习值函数估计研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022
Authors:  何强
Adobe PDF(4687Kb)  |  Favorite  |  View/Download:39/2  |  Submit date:2022/06/17
深度强化学习  值函数估计  值函数表示  集成强化学习  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
Authors:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  Favorite  |  View/Download:40/1  |  Submit date:2022/07/12
基于演示示教的机器人技能模仿学习 学位论文
, 智能化大厦: 中科院自动化所, 2021
Authors:  夏鹏程
Adobe PDF(16930Kb)  |  Favorite  |  View/Download:75/6  |  Submit date:2021/06/18
演示示教  域自适应  轨迹模仿  深度强化学习  
智能机器人共享控制与操作技能学习方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  席宝
Adobe PDF(9051Kb)  |  Favorite  |  View/Download:142/12  |  Submit date:2021/02/01
位姿检测  共享控制  强化学习  策略梯度  示教引导  
面向未知环境自主探索的深度强化学习方法 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  李浩然
Adobe PDF(13496Kb)  |  Favorite  |  View/Download:390/16  |  Submit date:2020/09/02
移动机器人  深度强化学习  自主探索  智能驾驶  多传感器融合  深度学习  语义分割  
任务型对话系统中对话管理方法研究 学位论文
, 中科院自动化所: 中国科学院大学, 2020
Authors:  王唯康
Adobe PDF(2587Kb)  |  Favorite  |  View/Download:243/0  |  Submit date:2020/06/10
自然语言处理  任务型对话系统  对话管理  强化学习  对话策略  
基于混合更新Q值的深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  李主南
Adobe PDF(3839Kb)  |  Favorite  |  View/Download:108/4  |  Submit date:2020/06/10
深度强化学习  Q 学习算法  过估计  欠估计  Actor-Critic  凸组合  混合更新  
平行学习理论及其在智能交通系统中的应用 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  林懿伦
Adobe PDF(17378Kb)  |  Favorite  |  View/Download:294/1  |  Submit date:2019/07/15
平行学习  强化学习  深度学习  智能交通系统  
基于深度强化学习的游戏智能决策 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  邵坤
Adobe PDF(13984Kb)  |  Favorite  |  View/Download:712/21  |  Submit date:2019/06/27
深度强化学习  深度学习  强化学习  智能决策  游戏人工智能  多智能体系统