CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于因果建模的强化学习控制:现状及展望 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677
作者:  孙悦雯;  柳文章;  孙长银
Adobe PDF(1926Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/05/09
强化学习控制  因果发现  因果推理  迁移学习  表示学习  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:29/11  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:80/20  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
作者:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:496/84  |  提交时间:2022/07/12
深度强化学习综述:兼论计算机围棋的发展 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717
作者:  赵冬斌;  邵坤;  朱圆恒;  李栋;  陈亚冉;  王海涛;  刘德荣;  周彤;  王成红
浏览  |  Adobe PDF(2816Kb)  |  收藏  |  浏览/下载:1777/653  |  提交时间:2017/09/13
深度强化学习  初弈号  深度学习  强化学习  人工智能