CASIA OpenIR

浏览/检索结果: 共43条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:37/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:15/10  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
双足机器人步态生成的研究 学位论文
, 2024
作者:  崔凌志
Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:32/1  |  提交时间:2024/07/01
请双足机器人控制  混合零动力  轨迹自由强化学习  周期性步态奖励机制  动态步态优化  模型融合策略  
基于强化学习的视觉内容生成 学位论文
, 2024
作者:  秦子涵
Adobe PDF(11517Kb)  |  收藏  |  浏览/下载:32/2  |  提交时间:2024/06/26
图像生成  视频生成  强化学习  
基于视觉表征的深度强化学习方法 学位论文
, 2024
作者:  刘民颂
Adobe PDF(10778Kb)  |  收藏  |  浏览/下载:42/4  |  提交时间:2024/06/22
深度强化学习,视觉表征学习,自监督学习,状态抽象,Transformer神经网络  
面向多目标覆盖任务的深度强化学习迁移泛化方法研究 学位论文
, 2024
作者:  徐一凡
Adobe PDF(20521Kb)  |  收藏  |  浏览/下载:35/3  |  提交时间:2024/06/20
多目标覆盖任务  强化学习  迁移泛化  课程学习  域自适应  环境偏移  
基于类脑脉冲神经网络的强化学习算法研究 学位论文
, 2024
作者:  张笃振
Adobe PDF(23167Kb)  |  收藏  |  浏览/下载:69/2  |  提交时间:2024/06/07
类脑智能 脉冲神经网络 强化学习  
受大脑运动准备及肌肉协同机制启发的肌肉骨骼机器人运动学习研究 学位论文
, 2024
作者:  王萧娜
Adobe PDF(11669Kb)  |  收藏  |  浏览/下载:42/3  |  提交时间:2024/06/05
肌肉骨骼机器人,生物启发式运动学习,运动准备,肌肉协同词  
类脑心理揣测脉冲神经网络模型研究 学位论文
, 2024
作者:  Zhao,Zhuoya
Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:27/2  |  提交时间:2024/06/04
类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:83/7  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型