CASIA OpenIR

Browse/Search Results:  1-2 of 2 Help

Selected(0)Clear Items/Page:    Sort:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
Authors:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  Favorite  |  View/Download:15/10  |  Submit date:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
Authors:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  Favorite  |  View/Download:57/25  |  Submit date:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习