CASIA OpenIR

浏览/检索结果: 共245条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
AI资讯 2024年 第06期(总第122期) 其他
2024-06-01
作者:  张桂英
Adobe PDF(8623Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/07/01
AI资讯 2022年 第07期(总第99期) 其他
2022-07-01
作者:  张桂英
Adobe PDF(7409Kb)  |  收藏  |  浏览/下载:3/2  |  提交时间:2024/07/01
AI资讯 2022年 第05期(总第97期) 其他
2022-05-01
作者:  张桂英
Adobe PDF(6653Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/07/01
双足机器人步态生成的研究 学位论文
, 2024
作者:  崔凌志
Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:24/1  |  提交时间:2024/07/01
请双足机器人控制  混合零动力  轨迹自由强化学习  周期性步态奖励机制  动态步态优化  模型融合策略  
基于强化学习的视觉内容生成 学位论文
, 2024
作者:  秦子涵
Adobe PDF(11517Kb)  |  收藏  |  浏览/下载:28/2  |  提交时间:2024/06/26
图像生成  视频生成  强化学习  
自然语言嵌入的深度强化学习探索方法研究 学位论文
, 2024
作者:  郭洲蕊
Adobe PDF(7588Kb)  |  收藏  |  浏览/下载:31/1  |  提交时间:2024/06/26
深度强化学习  自然语言  探索  
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:19/7  |  提交时间:2024/06/25
强化学习,分层强化学习  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:13/6  |  提交时间:2024/06/25
A Brain-inspired Theory of Collective Mind Model for Efficient Social Cooperation 期刊论文
IEEE Transactions on Artificial Intelligence, 2024, 页码: 无
作者:  Zhao,Zhuoya;  Zhao,Feifei;  Wang,Shiwen;  Sun,Yinqian;  Zeng,Yi
Adobe PDF(2270Kb)  |  收藏  |  浏览/下载:14/11  |  提交时间:2024/06/25