CASIA OpenIR

浏览/检索结果: 共163条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:12/0  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于强化学习的电网调度研究 学位论文
, 2024
作者:  王威
Adobe PDF(18647Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/30
电网自动化调度  电网有功出力调度  电网拓扑结构优化  强化学习  
基于解释增强的预训练语言模型知识利用关键技术研究 学位论文
, 2024
作者:  杨朝
Adobe PDF(2885Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29
预训练语言模型  可解释性  知识迁移  知识筛选  知识激活  
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
管道式任务型对话系统关键技术研究 学位论文
, 2024
作者:  邱俊彦
Adobe PDF(5583Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/27
任务型对话系统  对话状态跟踪  对话策略  自然语言生成  
面向平行交通系统的城市交通控制基础模型关键技术 学位论文
, 2024
作者:  赵宸
Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:23/1  |  提交时间:2024/05/27
平行交通系统  交通控制  平行学习  强化学习  基础模型  
基于主动学习的大规模复杂场景三维语义分割 学位论文
, 2023
作者:  荣梦琪
Adobe PDF(22974Kb)  |  收藏  |  浏览/下载:198/15  |  提交时间:2023/09/03
大规模  复杂三维场景  三维语义分割  主动学习  
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:102/3  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏