CASIA OpenIR

浏览/检索结果: 共28条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
基于深度强化学习的足球智能体球员策略方法研究 学位论文
, 2024
作者:  刘博寅
Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:22/0  |  提交时间:2024/07/12
足球  多智能体系统  深度强化学习  互信息  内在激励  预训练  
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
作者:  张熙
Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:27/2  |  提交时间:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:36/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:30/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
自然语言嵌入的深度强化学习探索方法研究 学位论文
, 2024
作者:  郭洲蕊
Adobe PDF(7588Kb)  |  收藏  |  浏览/下载:33/1  |  提交时间:2024/06/26
深度强化学习  自然语言  探索  
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:14/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:33/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
跨语言语义关联增强的无监督机器翻译方法研究 学位论文
, 2024
作者:  陆金梁
Adobe PDF(3544Kb)  |  收藏  |  浏览/下载:66/5  |  提交时间:2024/06/13
神经机器翻译,跨语言预训练,译文质量估计,译文回翻,互信息  
基于预训练模型的决策序列化建模研究 学位论文
, 2024
作者:  林润基
Adobe PDF(7811Kb)  |  收藏  |  浏览/下载:62/1  |  提交时间:2024/06/07
预训练模型  决策序列化  序列模型  
受大脑运动准备及肌肉协同机制启发的肌肉骨骼机器人运动学习研究 学位论文
, 2024
作者:  王萧娜
Adobe PDF(11669Kb)  |  收藏  |  浏览/下载:41/3  |  提交时间:2024/06/05
肌肉骨骼机器人,生物启发式运动学习,运动准备,肌肉协同词