CASIA OpenIR

Browse/Search Results:  1-10 of 1622 Help

Selected(0)Clear Items/Page:    Sort:
Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning 期刊
创刊日期: 2018,
Sponsors:  Liu BY(刘博寅)
Adobe PDF(5797Kb)  |  Favorite  |  View/Download:14/4  |  Submit date:2024/07/12
QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12
Authors:  Liu BY(刘博寅)
Adobe PDF(6675Kb)  |  Favorite  |  View/Download:11/1  |  Submit date:2024/07/12
基于深度强化学习的足球智能体球员策略方法研究 学位论文
, 2024
Authors:  刘博寅
Adobe PDF(11380Kb)  |  Favorite  |  View/Download:7/0  |  Submit date:2024/07/12
足球  多智能体系统  深度强化学习  互信息  内在激励  预训练  
VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文
, Canada, 2023
Authors:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(1199Kb)  |  Favorite  |  View/Download:21/6  |  Submit date:2024/07/08
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
Authors:  张熙
Adobe PDF(39126Kb)  |  Favorite  |  View/Download:16/1  |  Submit date:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文
, 线上, 2020-5
Authors:  Liu MS(刘民颂);  Zhu YH(朱圆恒);  Zhao DB(赵冬斌)
Adobe PDF(727Kb)  |  Favorite  |  View/Download:15/7  |  Submit date:2024/07/04
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
Authors:  王梓薏
Adobe PDF(7273Kb)  |  Favorite  |  View/Download:31/1  |  Submit date:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
Authors:  胡光政
Adobe PDF(17740Kb)  |  Favorite  |  View/Download:21/0  |  Submit date:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
自适应分布式聚合博弈广义纳什均衡算法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220
Authors:  时侠圣;  任璐;  孙长银
Adobe PDF(1595Kb)  |  Favorite  |  View/Download:13/5  |  Submit date:2024/07/02
聚合博弈  自适应  比例积分  梯度跟踪  一般线性多智能体系统  
基于自组织递归小波神经网络的污水处理过程多变量控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1199-1209
Authors:  苏尹;  杨翠丽;  乔俊飞
Adobe PDF(3815Kb)  |  Favorite  |  View/Download:16/8  |  Submit date:2024/07/02
神经网络控制  污水处理过程  自组织机制  多变量控制