CASIA OpenIR

浏览/检索结果: 共159条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于强化学习的电网调度研究 学位论文
, 2024
作者:  王威
Adobe PDF(18647Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/30
电网自动化调度  电网有功出力调度  电网拓扑结构优化  强化学习  
基于解释增强的预训练语言模型知识利用关键技术研究 学位论文
, 2024
作者:  杨朝
Adobe PDF(2885Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29
预训练语言模型  可解释性  知识迁移  知识筛选  知识激活  
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
管道式任务型对话系统关键技术研究 学位论文
, 2024
作者:  邱俊彦
Adobe PDF(5583Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/27
任务型对话系统  对话状态跟踪  对话策略  自然语言生成  
面向平行交通系统的城市交通控制基础模型关键技术 学位论文
, 2024
作者:  赵宸
Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:23/1  |  提交时间:2024/05/27
平行交通系统  交通控制  平行学习  强化学习  基础模型  
类别增量学习研究进展和性能评价 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 635−660
作者:  朱飞;  张煦尧;  刘成林
Adobe PDF(4601Kb)  |  收藏  |  浏览/下载:268/135  |  提交时间:2023/09/12
增量学习  持续学习  灾难性遗忘  机器学习  深度学习  
基于主动学习的大规模复杂场景三维语义分割 学位论文
, 2023
作者:  荣梦琪
Adobe PDF(22974Kb)  |  收藏  |  浏览/下载:198/15  |  提交时间:2023/09/03
大规模  复杂三维场景  三维语义分割  主动学习