Selected(0)Clear
Items/Page: Sort: |
| 对抗环境中基于值分解框架的多智能体协同算法研究 学位论文 工学硕士, 中科院自动化研究所: 中科院自动化研究所, 2022 Authors: 杨光开
Adobe PDF(17847Kb)  |   Favorite  |  View/Download:38/2  |  Submit date:2022/06/13 多智能体协同,信用分配,贝叶斯超网络,部分可观测约束,贝叶斯神经网络 |
| 面向连续控制任务的深度强化学习值函数估计研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院大学, 2022 Authors: 何强
Adobe PDF(4687Kb)  |   Favorite  |  View/Download:39/2  |  Submit date:2022/06/17 深度强化学习 值函数估计 值函数表示 集成强化学习 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 Authors: 杨光开 ; 陈皓 ; 张茗奕 ; 尹奇跃 ; 黄凯奇
Adobe PDF(1076Kb)  |   Favorite  |  View/Download:40/1  |  Submit date:2022/07/12 |
| 基于演示示教的机器人技能模仿学习 学位论文 , 智能化大厦: 中科院自动化所, 2021 Authors: 夏鹏程
Adobe PDF(16930Kb)  |   Favorite  |  View/Download:75/6  |  Submit date:2021/06/18 演示示教 域自适应 轨迹模仿 深度强化学习 |
| 智能机器人共享控制与操作技能学习方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 Authors: 席宝
Adobe PDF(9051Kb)  |   Favorite  |  View/Download:142/12  |  Submit date:2021/02/01 位姿检测 共享控制 强化学习 策略梯度 示教引导 |
| 面向未知环境自主探索的深度强化学习方法 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 Authors: 李浩然
Adobe PDF(13496Kb)  |   Favorite  |  View/Download:390/16  |  Submit date:2020/09/02 移动机器人 深度强化学习 自主探索 智能驾驶 多传感器融合 深度学习 语义分割 |
| 任务型对话系统中对话管理方法研究 学位论文 , 中科院自动化所: 中国科学院大学, 2020 Authors: 王唯康
Adobe PDF(2587Kb)  |   Favorite  |  View/Download:243/0  |  Submit date:2020/06/10 自然语言处理 任务型对话系统 对话管理 强化学习 对话策略 |
| 基于混合更新Q值的深度强化学习方法研究 学位论文 工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2020 Authors: 李主南
Adobe PDF(3839Kb)  |   Favorite  |  View/Download:108/4  |  Submit date:2020/06/10 深度强化学习 Q 学习算法 过估计 欠估计 Actor-Critic 凸组合 混合更新 |
| 平行学习理论及其在智能交通系统中的应用 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2019 Authors: 林懿伦
Adobe PDF(17378Kb)  |   Favorite  |  View/Download:294/1  |  Submit date:2019/07/15 平行学习 强化学习 深度学习 智能交通系统 |
| 基于深度强化学习的游戏智能决策 学位论文 工学博士学位, 中国科学院自动化研究所: 中国科学院大学, 2019 Authors: 邵坤
Adobe PDF(13984Kb)  |   Favorite  |  View/Download:712/21  |  Submit date:2019/06/27 深度强化学习 深度学习 强化学习 智能决策 游戏人工智能 多智能体系统 |