已选(0)清除
条数/页: 排序方式: |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦 Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 基于强化学习的电网调度研究 学位论文 , 2024 作者: 王威 Adobe PDF(18647Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/30 电网自动化调度 电网有功出力调度 电网拓扑结构优化 强化学习 |
| 基于解释增强的预训练语言模型知识利用关键技术研究 学位论文 , 2024 作者: 杨朝 Adobe PDF(2885Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29 预训练语言模型 可解释性 知识迁移 知识筛选 知识激活 |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |
| 多智能体强化学习预训练方法研究 学位论文 , 2024 作者: 孟令辉 Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/28 多智能体强化学习 预训练方法 神经网络 表示学习 在线强化评估 |
| 管道式任务型对话系统关键技术研究 学位论文 , 2024 作者: 邱俊彦 Adobe PDF(5583Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/27 任务型对话系统 对话状态跟踪 对话策略 自然语言生成 |
| 面向平行交通系统的城市交通控制基础模型关键技术 学位论文 , 2024 作者: 赵宸 Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:23/1  |  提交时间:2024/05/27 平行交通系统 交通控制 平行学习 强化学习 基础模型 |
| 类别增量学习研究进展和性能评价 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 635−660 作者: 朱飞; 张煦尧; 刘成林 Adobe PDF(4601Kb)  |  收藏  |  浏览/下载:268/135  |  提交时间:2023/09/12 增量学习 持续学习 灾难性遗忘 机器学习 深度学习 |
| 基于主动学习的大规模复杂场景三维语义分割 学位论文 , 2023 作者: 荣梦琪 Adobe PDF(22974Kb)  |  收藏  |  浏览/下载:198/15  |  提交时间:2023/09/03 大规模 复杂三维场景 三维语义分割 主动学习 |