CASIA OpenIR

浏览/检索结果: 共33条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
基于强化学习与安全约束的自动驾驶决策方法 期刊论文
交通运输研究, 2023, 卷号: 9, 期号: 1, 页码: 31-39
作者:  王宇霄;  刘敬玉;  李忠飞;  朱凤华
Adobe PDF(2613Kb)  |  收藏  |  浏览/下载:22/8  |  提交时间:2024/06/11
深度强化学习  自动驾驶  决策  安全约束  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:32/14  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
基于DDPG的三维重建模糊概率点推理 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 1105-1118
作者:  李雷;  徐浩;  吴素萍
Adobe PDF(6084Kb)  |  收藏  |  浏览/下载:32/11  |  提交时间:2024/05/20
三维重建  强化学习  深度学习  注意力机制  信息聚合  
数据驱动的保证收敛速率最优输出调节 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 980-991
作者:  姜艺;  范家璐;  柴天佑
Adobe PDF(1589Kb)  |  收藏  |  浏览/下载:12/6  |  提交时间:2024/05/20
保证收敛速率  最优输出调节  强化学习  值迭代  
基于多智能体强化学习的乳腺癌致病基因预测 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 5, 页码: 1246-1258
作者:  刘健;  顾扬;  程玉虎;  王雪松
Adobe PDF(9978Kb)  |  收藏  |  浏览/下载:27/7  |  提交时间:2024/05/20
乳腺癌  致病基因  基因排序  多智能体强化学习  演示学习  
基于GPR和深度强化学习的分层人机协作控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2352-2360
作者:  金哲豪;  刘安东;  俞立
Adobe PDF(5643Kb)  |  收藏  |  浏览/下载:10/4  |  提交时间:2024/05/20
深度强化学习  高斯过程回归  人体控制策略感知  分层人机协作  
基于强化学习的部分线性离散时间系统的最优输出调节 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2242-2253
作者:  庞文砚;  范家璐;  姜艺;  LEWISFrankLeroy
Adobe PDF(1892Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/05/20
输出调节  离散时间系统  强化学习  非线性未知动态  
基于改进粒子群算法的飞行器协同轨迹规划 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 11, 页码: 2670-2676
作者:  周宏宇;  王小刚;  单永志;  赵亚丽;  崔乃刚
Adobe PDF(2431Kb)  |  收藏  |  浏览/下载:32/14  |  提交时间:2024/05/20
高超声速飞行器  协同轨迹规划  粒子群优化  强化学习  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:32/10  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声