CASIA OpenIR

浏览/检索结果: 共8条,第1-8条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:25/1  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文
自动化学报, 2022, 页码: 0
作者:  吴哲;  李凯;  徐航;  兴军亮
Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:222/61  |  提交时间:2022/06/17
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:202/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  陈皓
Adobe PDF(13782Kb)  |  收藏  |  浏览/下载:319/14  |  提交时间:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
面向语音翻译的文本规范化和端到端建模方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  董倩倩
Adobe PDF(4379Kb)  |  收藏  |  浏览/下载:297/12  |  提交时间:2021/06/24
语音翻译、级联系统、文本规范化、端到端模型  
基于深度强化学习的群体协同决策关键问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  王彗木
Adobe PDF(8945Kb)  |  收藏  |  浏览/下载:298/1  |  提交时间:2021/06/24
群体系统  协同决策  多智能体系统  深度强化学习  图卷积网络  注 意力机制  
行人再识别关键问题研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2020
作者:  黄厚景
Adobe PDF(11976Kb)  |  收藏  |  浏览/下载:317/10  |  提交时间:2021/01/25
行人再识别,判别性特征,行人遮挡,领域自适应  
基于编解码框架的端到端语音识别技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  董林昊
Adobe PDF(5860Kb)  |  收藏  |  浏览/下载:397/27  |  提交时间:2020/06/13
语音识别技术  神经网络  编解码框架  端到端建模