已选(0)清除
条数/页: 排序方式: |
| 面向兵棋推演的多智能体智能博弈决策算法研究 学位论文 , 2023 作者: 余照科 Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:699/34  |  提交时间:2023/01/31 请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词 |
| Synergetic learning for unknown nonlinear H. control using neural networks 期刊论文 NEURAL NETWORKS, 2023, 卷号: 168, 页码: 287-299 作者: Zhu, Liao; Guo, Ping; Wei, Qinglai 收藏  |  浏览/下载:72/0  |  提交时间:2023/12/21 H. control Nonlinear systems Adaptive dynamic programming Temporal difference Neural network Data-driven |
| 面向工具使用的机器人技能学习方法研究 学位论文 , 2023 作者: 魏俊杭 Adobe PDF(15327Kb)  |  收藏  |  浏览/下载:157/9  |  提交时间:2023/10/25 机器人工具使用 多模态感知 自监督学习 复杂长序任务 |
| 基于深度强化学习的连续动作空中博弈对抗决策 学位论文 , 2023 作者: 李伟凡 Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:379/18  |  提交时间:2023/06/26 强化学习 深度强化学习 自注意力网络 智能决策 多智能体系统 |
| 融合信息素机制的大规模多智能体协同技术 学位论文 , 2023 作者: JiaHui Zhang Adobe PDF(5936Kb)  |  收藏  |  浏览/下载:158/3  |  提交时间:2023/06/26 大规模多智能体协同 多智能体强化学习 信息素机制 知识蒸馏 |
| PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文 Proceedings of the AAAI Conference on Artificial Intelligence, 美国 华盛顿, 2023.02.07 - 2023.02.14 作者: Bai FS(白丰硕); Zhang HM(张鸿铭); Tao TY(陶天阳); Wu ZH(武志亨); Wang YN(王燕娜); Xu B(徐博) Adobe PDF(1663Kb)  |  收藏  |  浏览/下载:161/37  |  提交时间:2023/07/05 Reinforcement Learning Algorithms Transfer Domain Adaptation Multi-Task Learning |
| 受脑启发的多任务域小样本连续学习方法研究 学位论文 , 2023 作者: 商迪 Adobe PDF(1921Kb)  |  收藏  |  浏览/下载:142/5  |  提交时间:2023/08/31 连续学习,小样本学习,多任务域学习,类脑计算,目标检测 |
| 面向开放世界分类的可信与增量学习 学位论文 , 2023 作者: 朱飞 Adobe PDF(19425Kb)  |  收藏  |  浏览/下载:177/18  |  提交时间:2023/09/12 深度学习 开放世界分类 可信学习 置信度估计 增量学习 |
| 信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文 , 2023 作者: 赵恩民 Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:187/10  |  提交时间:2023/06/08 信息不完备 复杂决策问题 强化学习 单智能体探索 不完美信息博弈 |
| 面向运动目标跟踪的机械臂补偿学习控制技术研究 学位论文 , 2023 作者: 王丽丽 Adobe PDF(9953Kb)  |  收藏  |  浏览/下载:145/7  |  提交时间:2023/06/02 视觉控制,运动目标操作,延时补偿,强化学习 |