CASIA OpenIR

浏览/检索结果: 共9条,第1-9条 帮助

已选(0)清除 条数/页:   排序方式:
Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文
, 日本, 2024-6
作者:  Zhang Qingyang;  Xu Bo
Adobe PDF(8862Kb)  |  收藏  |  浏览/下载:14/5  |  提交时间:2024/06/25
强化学习,分层强化学习  
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:19/7  |  提交时间:2024/06/25
强化学习,分层强化学习  
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:28/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
基于模仿学习的战术兵棋智能体构建与优化关键技术研究 学位论文
, 2024
作者:  王筱琦
Adobe PDF(2737Kb)  |  收藏  |  浏览/下载:41/1  |  提交时间:2024/06/06
兵棋推演  模仿学习  强化学习  人机对抗  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:69/6  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:26/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
分层强化学习的子目标生成与探索策略 学位论文
, 2024
作者:  王开申
Adobe PDF(8335Kb)  |  收藏  |  浏览/下载:38/0  |  提交时间:2024/05/27
分层强化学习,子目标生成,互信息,扩散模型  
基于深度强化学习的网约车调度算法研究 学位论文
, 2023
作者:  习金浩
Adobe PDF(15643Kb)  |  收藏  |  浏览/下载:139/8  |  提交时间:2023/06/08
Vehicle Repositioning  Deep Reinforcement Learning  Hierarchical Reinforcement Learning  Graph Neural Network  
肌肉骨骼机器人神经启发式分层运动学习研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  周俊杰
Adobe PDF(25529Kb)  |  收藏  |  浏览/下载:254/17  |  提交时间:2022/06/14
肌肉骨骼机器人系统  神经启发式算法  分层运动学习  行为决策