已选(0)清除
条数/页: 排序方式: |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| AI资讯 2024年 第06期(总第122期) 其他 2024-06-01 作者: 张桂英![](/image/person.jpg)
Adobe PDF(8623Kb)  |   收藏  |  浏览/下载:6/2  |  提交时间:2024/07/01 |
| AI资讯 2022年 第07期(总第99期) 其他 2022-07-01 作者: 张桂英![](/image/person.jpg)
Adobe PDF(7409Kb)  |   收藏  |  浏览/下载:3/2  |  提交时间:2024/07/01 |
| AI资讯 2022年 第05期(总第97期) 其他 2022-05-01 作者: 张桂英![](/image/person.jpg)
Adobe PDF(6653Kb)  |   收藏  |  浏览/下载:2/1  |  提交时间:2024/07/01 |
| 双足机器人步态生成的研究 学位论文 , 2024 作者: 崔凌志![](/image/person.jpg)
Adobe PDF(7077Kb)  |   收藏  |  浏览/下载:24/1  |  提交时间:2024/07/01 请双足机器人控制 混合零动力 轨迹自由强化学习 周期性步态奖励机制 动态步态优化 模型融合策略 |
| 基于强化学习的视觉内容生成 学位论文 , 2024 作者: 秦子涵![](/image/person.jpg)
Adobe PDF(11517Kb)  |   收藏  |  浏览/下载:28/2  |  提交时间:2024/06/26 图像生成 视频生成 强化学习 |
| 自然语言嵌入的深度强化学习探索方法研究 学位论文 , 2024 作者: 郭洲蕊![](/image/person.jpg)
Adobe PDF(7588Kb)  |   收藏  |  浏览/下载:31/1  |  提交时间:2024/06/26 深度强化学习 自然语言 探索 |
| Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang ; Yang Yiming ; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng ; Xu Bo![](/image/person.jpg)
Adobe PDF(7948Kb)  |   收藏  |  浏览/下载:19/7  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang ; Zhang Hongming; Xing Dengpeng ; Bo Xu![](/image/person.jpg)
Adobe PDF(9639Kb)  |   收藏  |  浏览/下载:13/6  |  提交时间:2024/06/25 |
| A Brain-inspired Theory of Collective Mind Model for Efficient Social Cooperation 期刊论文 IEEE Transactions on Artificial Intelligence, 2024, 页码: 无 作者: Zhao,Zhuoya ; Zhao,Feifei ; Wang,Shiwen; Sun,Yinqian ; Zeng,Yi![](/image/person.jpg)
Adobe PDF(2270Kb)  |   收藏  |  浏览/下载:14/11  |  提交时间:2024/06/25 |