CASIA OpenIR

浏览/检索结果: 共24条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:38/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
自然语言嵌入的深度强化学习探索方法研究 学位论文
, 2024
作者:  郭洲蕊
Adobe PDF(7588Kb)  |  收藏  |  浏览/下载:31/1  |  提交时间:2024/06/26
深度强化学习  自然语言  探索  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:12/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
基于视觉表征的深度强化学习方法 学位论文
, 2024
作者:  刘民颂
Adobe PDF(10778Kb)  |  收藏  |  浏览/下载:36/4  |  提交时间:2024/06/22
深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络  
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:31/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文
, 2024
作者:  徐一凡
Adobe PDF(20521Kb)  |  收藏  |  浏览/下载:32/3  |  提交时间:2024/06/20
多目标覆盖任务  强化学习  迁移泛化  课程学习  域自适应  环境偏移  
基于预训练模型的决策序列化建模研究 学位论文
, 2024
作者:  林润基
Adobe PDF(7811Kb)  |  收藏  |  浏览/下载:59/1  |  提交时间:2024/06/07
预训练模型  决策序列化  序列模型  
基于强化学习的电网调度研究 学位论文
, 2024
作者:  王威
Adobe PDF(18647Kb)  |  收藏  |  浏览/下载:18/1  |  提交时间:2024/05/30
电网自动化调度  电网有功出力调度  电网拓扑结构优化  强化学习  
分层强化学习的子目标生成与探索策略 学位论文
, 2024
作者:  王开申
Adobe PDF(8335Kb)  |  收藏  |  浏览/下载:44/0  |  提交时间:2024/05/27
分层强化学习,子目标生成,互信息,扩散模型