CASIA OpenIR

浏览/检索结果: 共47条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:32/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
基于预训练模型的决策序列化建模研究 学位论文
, 2024
作者:  林润基
Adobe PDF(7811Kb)  |  收藏  |  浏览/下载:59/1  |  提交时间:2024/06/07
预训练模型  决策序列化  序列模型  
Parallel Population and Parallel Human---A Cyber-Physical Social Approach 期刊论文
IEEE Intelligent Systems, 2022, 卷号: 37, 期号: 5, 页码: 19-27
作者:  Peijun Ye;  Fei-Yue Wang
Adobe PDF(3009Kb)  |  收藏  |  浏览/下载:41/12  |  提交时间:2024/06/06
Parallel Human  
MOT: A Mixture of Actors Reinforcement Learning Method by Optimal Transport for Algorithmic Trading 会议论文
, 台湾台北, 20240507-20240510
作者:  Cheng X(程曦);  Zhang JH(张景昊);  Ceng YN(曾宇楠);  Xue WF(薛文芳)
Adobe PDF(739Kb)  |  收藏  |  浏览/下载:31/8  |  提交时间:2024/06/03
Traffic Signal Control Based on Reinforcement Learning and Fuzzy Neural Network 会议论文
, Macau, China, October 8-12, 2022
作者:  Zhao, Hongxia;  Chen, Songhang;  Zhu, Fenghua;  Tang, Haina
Adobe PDF(565Kb)  |  收藏  |  浏览/下载:29/12  |  提交时间:2024/06/03
Advancing Air Combat Tactics with Improved Neural Fictitious Self-Play Reinforcement Learning 会议论文
Advanced Intelligent Computing Technology and Applications, 中国郑州, 2023-8
作者:  He SQ(何少钦);  Gao Y(高阳);  Zhang BF(张保丰);  Chang H(常惠);  Zhang XC(张鑫辰)
Adobe PDF(1496Kb)  |  收藏  |  浏览/下载:45/14  |  提交时间:2024/05/31
Air Combat, Reinforcement Learning, Neural Fictitious Self-Play.  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:43/5  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
, 中国重庆, 2024.5.7-5.9
作者:  Niu LY(钮龙宇);  Wan J(万军)
Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:37/8  |  提交时间:2024/05/28
深度强化学习  表征学习  分层学习  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:27/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:63/6  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估