CASIA OpenIR

Browse/Search Results:  1-10 of 10 Help

Selected(0)Clear Items/Page:    Sort:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
Authors:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  Favorite  |  View/Download:15/10  |  Submit date:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
基于视觉表征的深度强化学习方法 学位论文
, 2024
Authors:  刘民颂
Adobe PDF(10778Kb)  |  Favorite  |  View/Download:42/4  |  Submit date:2024/06/22
深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络  
基于预训练模型的决策序列化建模研究 学位论文
, 2024
Authors:  林润基
Adobe PDF(7811Kb)  |  Favorite  |  View/Download:63/1  |  Submit date:2024/06/07
预训练模型  决策序列化  序列模型  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
Authors:  杨依明
Adobe PDF(19731Kb)  |  Favorite  |  View/Download:45/5  |  Submit date:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
多智能体强化学习预训练方法研究 学位论文
, 2024
Authors:  孟令辉
Adobe PDF(6367Kb)  |  Favorite  |  View/Download:65/6  |  Submit date:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
兵棋推演的智能决策技术与挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
Authors:  尹奇跃;  赵美静;  倪晚成;  张俊格;  黄凯奇
Adobe PDF(4513Kb)  |  Favorite  |  View/Download:60/22  |  Submit date:2024/05/09
兵棋推演  人机对抗  智能决策技术  博弈学习  
仿生跳跃机器人运动控制与轨迹规划研究 学位论文
, 2023
Authors:  张弛
Adobe PDF(9151Kb)  |  Favorite  |  View/Download:218/5  |  Submit date:2023/06/09
仿生跳跃机器人  动力学建模  轨迹跟踪控制  轨迹生成  技能学习  
基于平行学习的混合智能调控方法与应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李小双
Adobe PDF(10128Kb)  |  Favorite  |  View/Download:221/13  |  Submit date:2022/06/20
平行学习  混合智能调控  示教数据  模仿学习  深度强化学习  
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
Authors:  唐振韬
Adobe PDF(23513Kb)  |  Favorite  |  View/Download:666/17  |  Submit date:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
多智能体博弈对抗的协同行为自学习算法与应用 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  董宗宽
Adobe PDF(4970Kb)  |  Favorite  |  View/Download:351/14  |  Submit date:2021/06/20
多智能体深度强化学习  协同行为学习  语言几何学  可解释性  Z学习