已选(0)清除
条数/页: 排序方式: |
| An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文 , 线上, 2020-5 作者: Liu MS(刘民颂) ; Zhu YH(朱圆恒) ; Zhao DB(赵冬斌)![](/image/person.jpg)
Adobe PDF(727Kb)  |   收藏  |  浏览/下载:22/10  |  提交时间:2024/07/04 |
| Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文 , 线上, 2020-4 作者: Zhao EM(赵恩民) ; Deng SH(邓诗弘); Zang YF(臧一凡); Kang YX(康永欣) ; Li K(李凯) ; Xing JL(兴军亮)![](/image/person.jpg)
Adobe PDF(1999Kb)  |   收藏  |  浏览/下载:122/46  |  提交时间:2023/06/29 |
| Stable Training of Bellman Error in Reinforcement Learning 会议论文 , Thailand, November 18–22 作者: Gong C(龚晨) ; Bai YP(白云鹏) ; Hou XW(侯新文) ; Ji XH(季晓慧)
Adobe PDF(2416Kb)  |   收藏  |  浏览/下载:131/37  |  提交时间:2023/06/27 |
| Deep Behavioral Cloning for Traffic Control with Virtual Expert Demonstration Under a Parallel Learning Framework 会议论文 , 北京, 2020-12 作者: Li Xiaoshuang ; Zhu Fenghua ; Wang Fei-Yue![](/image/person.jpg)
Adobe PDF(770Kb)  |   收藏  |  浏览/下载:197/84  |  提交时间:2022/06/16 |
| Occlusion-Aware Siamese Network for Human Pose Estimation 会议论文 , 英国(在线会议), 8.23-8.28 作者: Zhou Lu ; Chen Yingying; Gao Yunze ; Wang Jinqiao ; Lu Hanqing![](/image/person.jpg)
Adobe PDF(1420Kb)  |   收藏  |  浏览/下载:229/70  |  提交时间:2021/06/15 |