CASIA OpenIR

浏览/检索结果: 共51条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向兵棋推演的多智能体智能博弈决策算法研究 学位论文
, 2023
作者:  余照科
Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:699/34  |  提交时间:2023/01/31
请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词  
Synergetic learning for unknown nonlinear H. control using neural networks 期刊论文
NEURAL NETWORKS, 2023, 卷号: 168, 页码: 287-299
作者:  Zhu, Liao;  Guo, Ping;  Wei, Qinglai
收藏  |  浏览/下载:72/0  |  提交时间:2023/12/21
H. control  Nonlinear systems  Adaptive dynamic programming  Temporal difference  Neural network  Data-driven  
面向工具使用的机器人技能学习方法研究 学位论文
, 2023
作者:  魏俊杭
Adobe PDF(15327Kb)  |  收藏  |  浏览/下载:157/9  |  提交时间:2023/10/25
机器人工具使用  多模态感知  自监督学习  复杂长序任务  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:379/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
融合信息素机制的大规模多智能体协同技术 学位论文
, 2023
作者:  JiaHui Zhang
Adobe PDF(5936Kb)  |  收藏  |  浏览/下载:158/3  |  提交时间:2023/06/26
大规模多智能体协同  多智能体强化学习  信息素机制  知识蒸馏  
PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文
Proceedings of the AAAI Conference on Artificial Intelligence, 美国 华盛顿, 2023.02.07 - 2023.02.14
作者:  Bai FS(白丰硕);  Zhang HM(张鸿铭);  Tao TY(陶天阳);  Wu ZH(武志亨);  Wang YN(王燕娜);  Xu B(徐博)
Adobe PDF(1663Kb)  |  收藏  |  浏览/下载:161/37  |  提交时间:2023/07/05
Reinforcement Learning Algorithms  Transfer  Domain Adaptation  Multi-Task Learning  
受脑启发的多任务域小样本连续学习方法研究 学位论文
, 2023
作者:  商迪
Adobe PDF(1921Kb)  |  收藏  |  浏览/下载:142/5  |  提交时间:2023/08/31
连续学习,小样本学习,多任务域学习,类脑计算,目标检测  
面向开放世界分类的可信与增量学习 学位论文
, 2023
作者:  朱飞
Adobe PDF(19425Kb)  |  收藏  |  浏览/下载:177/18  |  提交时间:2023/09/12
深度学习  开放世界分类  可信学习  置信度估计  增量学习  
信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文
, 2023
作者:  赵恩民
Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:187/10  |  提交时间:2023/06/08
信息不完备  复杂决策问题  强化学习  单智能体探索  不完美信息博弈  
面向运动目标跟踪的机械臂补偿学习控制技术研究 学位论文
, 2023
作者:  王丽丽
Adobe PDF(9953Kb)  |  收藏  |  浏览/下载:145/7  |  提交时间:2023/06/02
视觉控制,运动目标操作,延时补偿,强化学习