CASIA OpenIR

浏览/检索结果: 共25条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文
, 2023
作者:  赵恩民
Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:187/10  |  提交时间:2023/06/08
信息不完备  复杂决策问题  强化学习  单智能体探索  不完美信息博弈  
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
, 2023
作者:  白云鹏
Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:152/9  |  提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心  
仿生跳跃机器人运动控制与轨迹规划研究 学位论文
, 2023
作者:  张弛
Adobe PDF(9151Kb)  |  收藏  |  浏览/下载:133/4  |  提交时间:2023/06/09
仿生跳跃机器人  动力学建模  轨迹跟踪控制  轨迹生成  技能学习  
面向稀疏奖励任务的深度强化学习探索方法研究 学位论文
, 2023
作者:  徐沛
Adobe PDF(10902Kb)  |  收藏  |  浏览/下载:108/8  |  提交时间:2023/06/16
深度强化学习  稀疏奖励  探索  
面向自然语言处理深度学习模型的归因解释研究 学位论文
, 2023
作者:  鞠一鸣
Adobe PDF(6216Kb)  |  收藏  |  浏览/下载:154/8  |  提交时间:2023/06/04
自然语言处理  可解释人工智能  深度学习  归因解释  事后解释  
执行者-评论家算法框架下的强化学习稳定性研究 学位论文
, 2023
作者:  龚晨
Adobe PDF(8324Kb)  |  收藏  |  浏览/下载:96/6  |  提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击  
足球比赛态势智能分析与决策辅助方法研究 学位论文
, 2023
作者:  陈敏
Adobe PDF(8212Kb)  |  收藏  |  浏览/下载:85/3  |  提交时间:2023/06/27
足球  态势分析  深度学习  多智能体强化学习  迁移学习  
融合对手建模的多风格策略集成算法研究 学位论文
, 2023
作者:  白丰硕
Adobe PDF(5376Kb)  |  收藏  |  浏览/下载:98/5  |  提交时间:2023/06/11
智能博弈对抗  深度强化学习  奖励重塑  多任务强化学习  对手建模  
嵌入结构先验的机器人技能学习算法研究 学位论文
, 2022
作者:  张丰一
Adobe PDF(16472Kb)  |  收藏  |  浏览/下载:177/5  |  提交时间:2023/01/12
技能学习  结构先验知识  机器人  状态表示学习  强化学习  
复杂网络中的异质性传播动力学分析与情景建模 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  罗天怡
Adobe PDF(10887Kb)  |  收藏  |  浏览/下载:273/13  |  提交时间:2022/07/12
异质性复杂网络  传染病传播模型  信息传播  情景建模  新型冠状病毒肺炎