CASIA OpenIR

浏览/检索结果: 共1118条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Offline Hierarchical Reinforcement Learning: Enable Large-Scale Training in HRL 会议论文
, Nanjing, 2023-11-27
作者:  Yuqiao Wu;  Haifeng Zhang;  Jun Wang
Adobe PDF(1339Kb)  |  收藏  |  浏览/下载:9/1  |  提交时间:2024/07/12
Autonomous Driving in Underground Mines via Parallel Driving Operation Systems: Challenges, Frameworks and Cases Study 期刊论文
IEEE Transactions on Intelligent Vehicles, 2024, 页码: 1-10
作者:  Bin Tian;  Caiji Zhang;  Xuedi Hao;  Shi Meng;  Shibin Wang;  Zheng Yang;  Long Chen;  Yanlong Zhao;  Shirong Ge
Adobe PDF(11335Kb)  |  收藏  |  浏览/下载:42/3  |  提交时间:2024/07/05
NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks 会议论文
, Queensland, Australia, 2023-6
作者:  Hu GZ(胡光政);  Li HR(李浩然);  Liu SS(刘莎莎);  Zhu YH(朱圆恒);  Zhao DB(赵冬斌)
Adobe PDF(2785Kb)  |  收藏  |  浏览/下载:27/7  |  提交时间:2024/07/04
An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文
, 线上, 2020-5
作者:  Liu MS(刘民颂);  Zhu YH(朱圆恒);  Zhao DB(赵冬斌)
Adobe PDF(727Kb)  |  收藏  |  浏览/下载:15/7  |  提交时间:2024/07/04
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:38/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
知识和数据驱动的污水处理反硝化脱氮过程协同优化控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1221-1233
作者:  韩红桂;  王玉爽;  刘峥;  孙浩源;  乔俊飞
Adobe PDF(3356Kb)  |  收藏  |  浏览/下载:20/9  |  提交时间:2024/07/02
污水处理反硝化脱氮过程  知识和数据驱动  协同优化控制  自适应知识核函数  知识引导的协同优化算法  
自适应分布式聚合博弈广义纳什均衡算法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220
作者:  时侠圣;  任璐;  孙长银
Adobe PDF(1595Kb)  |  收藏  |  浏览/下载:12/5  |  提交时间:2024/07/02
聚合博弈  自适应  比例积分  梯度跟踪  一般线性多智能体系统  
基于自组织递归小波神经网络的污水处理过程多变量控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1199-1209
作者:  苏尹;  杨翠丽;  乔俊飞
Adobe PDF(3815Kb)  |  收藏  |  浏览/下载:13/6  |  提交时间:2024/07/02
神经网络控制  污水处理过程  自组织机制  多变量控制