CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

已选(0)清除 条数/页:   排序方式:
面向交叉路口通行的自动驾驶强化学习方法 学位论文
, 2024
作者:  刘育琦
Adobe PDF(24247Kb)  |  收藏  |  浏览/下载:7/1  |  提交时间:2024/06/03
深度强化学习  自动驾驶  交叉路口通行  场景集  安全强化学习  图卷积网络  
面向多任务和属性泛化的多智能体强化学习算法研究 学位论文
, 2024
作者:  黄上京
Adobe PDF(15636Kb)  |  收藏  |  浏览/下载:25/1  |  提交时间:2024/06/01
多智能体强化学习  多任务强化学习  多智能体属性组成泛化  实体多机器人平台  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:30/3  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
融合对手建模的多风格策略集成算法研究 学位论文
, 2023
作者:  白丰硕
Adobe PDF(5376Kb)  |  收藏  |  浏览/下载:102/5  |  提交时间:2023/06/11
智能博弈对抗  深度强化学习  奖励重塑  多任务强化学习  对手建模  
面向信息网络的表示与关联方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  车飞虎
Adobe PDF(8695Kb)  |  收藏  |  浏览/下载:153/7  |  提交时间:2022/06/17
信息网络  网络表示学习  自举机制  对比学习  负样本采样