CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共7条,第1-7条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
Data-efficient model-based reinforcement learning with trajectory discrimination 期刊论文
COMPLEX & INTELLIGENT SYSTEMS, 2023, 页码: 10
作者:  Qu, Tuo;  Duan, Fuqing;  Zhang, Junge;  Zhao, Bo;  Huang, Wenzhen
收藏  |  浏览/下载:115/0  |  提交时间:2023/11/16
Reinforcement learning  Deep learning  Continuous control task  World model  
Bootstrap Estimated Uncertainty of the Environment Model for Model-Based Reinforcement Learning 会议论文
, Honolulu, Hawaii, USA, 2019-1
作者:  Huang, Wenzhen;  Zhang, Junge;  Huang, Kaiqi
Adobe PDF(5079Kb)  |  收藏  |  浏览/下载:141/46  |  提交时间:2022/01/11
Learning to Reweight Imaginary Transitions for Model-Based Reinforcement Learning 会议论文
, online, 2021-2
作者:  Huang, Wenzhen;  Yin Qiyue;  Zhang Junge;  Huang, Kaiqi
Adobe PDF(5676Kb)  |  收藏  |  浏览/下载:177/42  |  提交时间:2022/01/11
强化学习中环境建模误差问题研究 学位论文
, 中国科学院大学: 中国科学院大学人工智能学院, 2021
作者:  黄文振
Adobe PDF(69564Kb)  |  收藏  |  浏览/下载:190/8  |  提交时间:2022/01/11
基于模型的强化学习  深度强化学习  元学习  
A Self-Paced Category-Aware Approach For Unsupervised Adaptation Networks 会议论文
, New Orleans, Louisiana, USA, 2017-11-18
作者:  Huang WZ(黄文振);  Yang PP(杨沛沛);  Huang KQ(黄凯奇)
浏览  |  Adobe PDF(766Kb)  |  收藏  |  浏览/下载:293/102  |  提交时间:2018/01/05
From Classification to Regression: Model Transfer for Visual Aesthetic Quality Assessment 会议论文
, NANJING CHINA, 2017-11-26
作者:  Huang WZ(黄文振);  Yang PP(杨沛沛);  Huang KQ(黄凯奇)
浏览  |  Adobe PDF(2383Kb)  |  收藏  |  浏览/下载:289/80  |  提交时间:2018/01/04
迁移学习中弱标注信息的挖掘与利用 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  黄文振
Adobe PDF(6331Kb)  |  收藏  |  浏览/下载:252/7  |  提交时间:2017/06/19
迁移学习  无监督领域自适应  深度学习  美感质量评估