CASIA OpenIR

Browse/Search Results:  1-2 of 2 Help

Filters    
Selected(0)Clear Items/Page:    Sort:
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
Authors:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  Favorite  |  View/Download:51/22  |  Submit date:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
Authors:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  Favorite  |  View/Download:101/25  |  Submit date:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习