CASIA OpenIR

浏览/检索结果: 共1372条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning to Play Football from Sports Perspective: A Knowledge-embedded Deep Reinforcement Learning Framework 期刊论文
IEEE Transactions on Games, 2022, 页码: 12
作者:  Liu BY(刘博寅)
Adobe PDF(2957Kb)  |  收藏  |  浏览/下载:17/5  |  提交时间:2024/07/12
QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12
作者:  Liu BY(刘博寅)
Adobe PDF(6675Kb)  |  收藏  |  浏览/下载:13/2  |  提交时间:2024/07/12
VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文
, Canada, 2023
作者:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(1199Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/07/08
Learning State-Specific Action Masks for Reinforcement Learning 期刊论文
Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60
作者:  Wang ZY(王梓薏);  Li XR(李欣然);  Sun LY(孙罗洋);  Zhang HF(张海峰);  Liu HL(刘华林);  Jun Wang
Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:24/12  |  提交时间:2024/07/05
reinforcement learning  exploration efficiency  space reduction  
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:35/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
知识和数据驱动的污水处理反硝化脱氮过程协同优化控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1221-1233
作者:  韩红桂;  王玉爽;  刘峥;  孙浩源;  乔俊飞
Adobe PDF(3356Kb)  |  收藏  |  浏览/下载:25/12  |  提交时间:2024/07/02
污水处理反硝化脱氮过程  知识和数据驱动  协同优化控制  自适应知识核函数  知识引导的协同优化算法  
自适应分布式聚合博弈广义纳什均衡算法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220
作者:  时侠圣;  任璐;  孙长银
Adobe PDF(1595Kb)  |  收藏  |  浏览/下载:14/6  |  提交时间:2024/07/02
聚合博弈  自适应  比例积分  梯度跟踪  一般线性多智能体系统  
高超声速飞行器指定时间时变高增益反馈跟踪控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1151-1159
作者:  张康康;  周彬;  蔡光斌;  侯明哲
Adobe PDF(1479Kb)  |  收藏  |  浏览/下载:23/12  |  提交时间:2024/07/02
高超声速飞行器  指定时间控制  时变反馈  高增益反馈  非线性控制  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:11/7  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
Gait Learning for 3D Bipedal Robots Based on a Combined Strategy of Hybrid Zero Dynamics Feedback Control and Periodic Reward 会议论文
, 中国湖南长沙, 2024-5-25
作者:  Cui LZ(崔凌志);  Tianqi Deng;  Lihua Ma;  Wenhao He
Adobe PDF(690Kb)  |  收藏  |  浏览/下载:24/9  |  提交时间:2024/07/01