CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:12/8  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
基于多智能体强化学习的乳腺癌致病基因预测 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 5, 页码: 1246-1258
作者:  刘健;  顾扬;  程玉虎;  王雪松
Adobe PDF(9978Kb)  |  收藏  |  浏览/下载:44/14  |  提交时间:2024/05/20
乳腺癌  致病基因  基因排序  多智能体强化学习  演示学习  
考虑输出约束的冗余驱动绳索并联机器人预设性能控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1704-1717
作者:  陈正升;  程玉虎;  王雪松
Adobe PDF(3269Kb)  |  收藏  |  浏览/下载:15/7  |  提交时间:2024/05/20
滑模控制  有限时间收敛  输出约束  给定时间预设性能控制  冗余驱动绳索并联机器人  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:53/23  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:105/26  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习