CASIA OpenIR

浏览/检索结果: 共175条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
Conditional Feature Generation for Transductive Open-Set Recognition 期刊论文
Pattern Recognition, 2023, 卷号: 146, 页码: 1-11
作者:  Jiayin, Sun;  Qiulei, Dong
Adobe PDF(1500Kb)  |  收藏  |  浏览/下载:15/0  |  提交时间:2024/05/28
Explainable Reinforcement Learning via a Causal World Model 会议论文
Proceedings of the 32nd International Joint Conference on Artificial Intelligence, 中国澳门, 2023-08-22
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(850Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/28
强化学习  可解释人工智能  因果推理  
Dual Self-Awareness Value Decomposition Framework without Individual Global Max for Cooperative MARL 会议论文
, New Orleans, LA, USA, December 10-16, 2023
作者:  Zhiwei Xu;  Bin Zhang;  Dapeng Li;  Guangchong Zhou;  Zeren Zhang;  Guoliang Fan
Adobe PDF(8700Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/28
HAVEN: Hierarchical Cooperative Multi-Agent Reinforcement Learning with Dual Coordination Mechanism 会议论文
, Washington, DC, USA, February 7-14, 2023
作者:  Zhiwei Xu;  Yunpeng Bai;  Bin Zhang;  Dapeng Li;  Guoliang Fan
Adobe PDF(3345Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
Parallel Learning Based Foundation Model for Networked Traffic Signal Control 会议论文
, Bilbao, Bizkaia, Spain, 2022-9-24
作者:  Zhao, Chen;  Dai, Xingyuan;  Chen, Yuanyuan;  Yilun, Lin;  Lv, Yisheng;  Wang, Fei-Yue
Adobe PDF(1112Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/28
复杂工业过程非串级双速率组合分散运行优化控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 172-184
作者:  赵建国;  杨春雨
Adobe PDF(1648Kb)  |  收藏  |  浏览/下载:33/11  |  提交时间:2024/05/09
复杂工业过程  运行优化控制  奇异摄动理论  Q-学习  双速率  
考虑全局和局部帕累托前沿的多模态多目标优化算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 148-160
作者:  李文桦;  明梦君;  张涛;  王锐;  黄生俊;  王凌
Adobe PDF(3530Kb)  |  收藏  |  浏览/下载:32/10  |  提交时间:2024/05/09
多模态多目标优化  局部收敛性  进化算法  种群多样性  
未知非线性零和博弈最优跟踪的事件触发控制设计 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 91-101
作者:  王鼎;  胡凌治;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(1996Kb)  |  收藏  |  浏览/下载:17/8  |  提交时间:2024/05/09
自适应评判设计  事件触发控制  神经网络  最优跟踪控制  稳定性分析  零和博弈  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声