CASIA OpenIR

Browse/Search Results:  1-10 of 110 Help

Selected(0)Clear Items/Page:    Sort:
面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文
, 2024
Authors:  徐一凡
Adobe PDF(20521Kb)  |  Favorite  |  View/Download:19/2  |  Submit date:2024/06/20
多目标覆盖任务  强化学习  迁移泛化  课程学习  域自适应  环境偏移  
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
Authors:  何少钦
Adobe PDF(4570Kb)  |  Favorite  |  View/Download:26/1  |  Submit date:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
Authors:  付清旭
Adobe PDF(39071Kb)  |  Favorite  |  View/Download:35/5  |  Submit date:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
基于解释增强的预训练语言模型知识利用关键技术研究 学位论文
, 2024
Authors:  杨朝
Adobe PDF(2885Kb)  |  Favorite  |  View/Download:22/3  |  Submit date:2024/05/29
预训练语言模型  可解释性  知识迁移  知识筛选  知识激活  
多智能体强化学习预训练方法研究 学位论文
, 2024
Authors:  孟令辉
Adobe PDF(6367Kb)  |  Favorite  |  View/Download:51/6  |  Submit date:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
多智能体策略一致性奖励塑造算法研究 学位论文
, 2024
Authors:  杨晨
Adobe PDF(6011Kb)  |  Favorite  |  View/Download:21/0  |  Submit date:2024/05/27
多智能体系统  深度强化学习  信用分配  奖励塑造  
基于多对多生成对抗网络的非对称跨域迁移行人再识别 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 103-120
Authors:  梁文琦;  王广聪;  赖剑煌
Adobe PDF(20818Kb)  |  Favorite  |  View/Download:22/8  |  Submit date:2024/05/20
行人再识别  多对多跨域迁移  非监督迁移学习  生成对抗网络  
面向网络空间防御的对抗机器学习研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1625-1649
Authors:  余正飞;  闫巧;  周鋆
Adobe PDF(2039Kb)  |  Favorite  |  View/Download:16/8  |  Submit date:2024/05/20
网络空间防御  对抗机器学习  投毒攻击  规避攻击  对抗样本  
基于势博弈的异构多智能体系统任务分配和重分配 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2416-2428
Authors:  鞠锴;  冒泽慧;  姜斌;  马亚杰
Adobe PDF(2021Kb)  |  Favorite  |  View/Download:6/3  |  Submit date:2024/05/20
任务分配  多智能体系统  势博弈  约束优化  容错  
惯性组合导航系统性能评估方法研究进展 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2361-2373
Authors:  董铭涛;  程建华;  赵琳;  刘萍
Adobe PDF(1740Kb)  |  Favorite  |  View/Download:19/8  |  Submit date:2024/05/20
惯性组合导航系统  性能评估  指标体系  无量纲化方法  组合权重  评估方法