CASIA OpenIR

浏览/检索结果: 共39条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:34/13  |  提交时间:2024/06/25
强化学习,分层强化学习  
基于强化学习与安全约束的自动驾驶决策方法 期刊论文
交通运输研究, 2023, 卷号: 9, 期号: 1, 页码: 31-39
作者:  王宇霄;  刘敬玉;  李忠飞;  朱凤华
Adobe PDF(2613Kb)  |  收藏  |  浏览/下载:46/22  |  提交时间:2024/06/11
深度强化学习  自动驾驶  决策  安全约束  
Explainable Reinforcement Learning via a Causal World Model 会议论文
Proceedings of the 32nd International Joint Conference on Artificial Intelligence, 中国澳门, 2023-08-22
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(850Kb)  |  收藏  |  浏览/下载:50/22  |  提交时间:2024/05/28
强化学习  可解释人工智能  因果推理  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:45/14  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
不确定工业过程运行指标异步更新强化学习决策算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:  李金娜;  袁林;  丁进良
Adobe PDF(1941Kb)  |  收藏  |  浏览/下载:62/25  |  提交时间:2024/05/09
运行优化控制  强化学习  数据驱动控制  自适应动态规划  安全运行  
无人机反应式扰动流体路径规划 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287
作者:  吴健发;  王宏伦;  王延祥;  刘一恒
Adobe PDF(4624Kb)  |  收藏  |  浏览/下载:44/18  |  提交时间:2024/05/09
无人机  反应式路径规划  受约束扰动流体动态系统  深度强化学习  训练环境  
基于因果建模的强化学习控制:现状及展望 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677
作者:  孙悦雯;  柳文章;  孙长银
Adobe PDF(1926Kb)  |  收藏  |  浏览/下载:51/13  |  提交时间:2024/05/09
强化学习控制  因果发现  因果推理  迁移学习  表示学习  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:32/11  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
端边云协同的PID整定智能系统 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 514-527
作者:  柴天佑;  周正;  郑锐;  刘宁;  贾瑶
Adobe PDF(4613Kb)  |  收藏  |  浏览/下载:53/18  |  提交时间:2024/05/09
PID参数整定  端边云协同技术  深度学习  强化学习  智能系统  
深度强化学习联合回归目标定位 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 1089-1098
作者:  姚红革;  张玮;  杨浩琪;  喻钧
Adobe PDF(4106Kb)  |  收藏  |  浏览/下载:42/15  |  提交时间:2024/05/09
视觉注意机制  循环神经网络  深度强化学习  目标定位