CASIA OpenIR

Browse/Search Results:  1-10 of 68 Help

Selected(0)Clear Items/Page:    Sort:
基于深度强化学习的足球智能体球员策略方法研究 学位论文
, 2024
Authors:  刘博寅
Adobe PDF(11380Kb)  |  Favorite  |  View/Download:12/0  |  Submit date:2024/07/12
足球  多智能体系统  深度强化学习  互信息  内在激励  预训练  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
Authors:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  Favorite  |  View/Download:9/5  |  Submit date:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
自然语言嵌入的深度强化学习探索方法研究 学位论文
, 2024
Authors:  郭洲蕊
Adobe PDF(7588Kb)  |  Favorite  |  View/Download:32/1  |  Submit date:2024/06/26
深度强化学习  自然语言  探索  
面向复杂装配任务的机器人轨迹规划与柔顺控制技术研究 学位论文
, 2024
Authors:  沈炼成
Adobe PDF(29544Kb)  |  Favorite  |  View/Download:19/1  |  Submit date:2024/06/24
轨迹规划,装配策略,柔顺控制  
基于基础模型的分层强化学习 学位论文
, 2024
Authors:  吴俣桥
Adobe PDF(16716Kb)  |  Favorite  |  View/Download:32/0  |  Submit date:2024/06/21
强化学习  分层强化学习  基础模型  
面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文
, 2024
Authors:  徐一凡
Adobe PDF(20521Kb)  |  Favorite  |  View/Download:33/3  |  Submit date:2024/06/20
多目标覆盖任务  强化学习  迁移泛化  课程学习  域自适应  环境偏移  
基于预训练模型的决策序列化建模研究 学位论文
, 2024
Authors:  林润基
Adobe PDF(7811Kb)  |  Favorite  |  View/Download:59/1  |  Submit date:2024/06/07
预训练模型  决策序列化  序列模型  
基于类脑脉冲神经网络的强化学习算法研究 学位论文
, 2024
Authors:  张笃振
Adobe PDF(23167Kb)  |  Favorite  |  View/Download:63/2  |  Submit date:2024/06/07
类脑智能 脉冲神经网络 强化学习  
基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文
, 2024
Authors:  王筱琦
Adobe PDF(2737Kb)  |  Favorite  |  View/Download:43/1  |  Submit date:2024/06/06
兵棋推演  模仿学习  强化学习  人机对抗  
自监督机器人操作任务视觉表征学习方法研究 学位论文
, 2024
Authors:  马文轩
Adobe PDF(16914Kb)  |  Favorite  |  View/Download:34/2  |  Submit date:2024/06/04
自监督学习  机器人操作任务学习  视觉表征学习  具身视觉感知