已选(0)清除
条数/页: 排序方式: |
| A cooperation and decision-making framework in dynamic confrontation for multi-agent systems 期刊论文 Computers and Electrical Engineering, 2024, 页码: 118 作者: Lexing Wang; Tenghai Qiu ; Zhiqiang Pu ; Jianqiang Yi![](/image/person.jpg)
Adobe PDF(1302Kb)  |   收藏  |  浏览/下载:17/4  |  提交时间:2024/06/06 |
| Joint caching and transmission in the mobile edge network: An multi-agent learning approach 会议论文 , Madrid, Spain, 2021-12-7 作者: Mi,Qirui; Yang,Ning ; Zhang,Haifeng; Zhang,Haijun; Wang,Jun
Adobe PDF(1724Kb)  |   收藏  |  浏览/下载:21/7  |  提交时间:2024/06/05 |
| Fuzzy Feedback Multi-Agent Reinforcement Learning for Adversarial Dynamic Multi-Team Competitions 期刊论文 IEEE Transactions on Fuzzy Systems, 2024, 页码: 1 作者: Qingxu Fu ; Zhiqiang Pu ; Yi Pan; Tenghai Qiu ; Jianqiang Yi![](/image/person.jpg)
Adobe PDF(4975Kb)  |   收藏  |  浏览/下载:14/5  |  提交时间:2024/06/05 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:25/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 医疗领域任务型对话系统研究 学位论文 , 2024 作者: 胡泽发![](/image/person.jpg)
Adobe PDF(3935Kb)  |   收藏  |  浏览/下载:41/3  |  提交时间:2024/05/29 医疗对话系统 任务型对话系统 对话理解 对话推理 幻觉现象 |
| Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning 会议论文 , Queensland, Australia, 2023-6 作者: Yang, Chen ; Yang, Guangkai ; Chen, Hao ; Zhang, Junge![](/image/person.jpg)
Adobe PDF(3027Kb)  |   收藏  |  浏览/下载:32/13  |  提交时间:2024/05/29 |
| Multi-UAV Cooperative Short-Range Combat via Attention-Based Reinforcement Learning using Individual Reward Shaping 会议论文 , Kyoto, Japan, October 23-27, 2022 作者: Zhang TL(张天乐) ; Qiu TH(丘腾海) ; Liu Z(刘振) ; Pu ZQ(蒲志强) ; Yi JQ(易建强)![](/image/person.jpg)
Adobe PDF(896Kb)  |   收藏  |  浏览/下载:148/48  |  提交时间:2023/06/12 |
| Multi-Agent Uncertainty Sharing for Cooperative Multi-Agent Reinforcement Learning 会议论文 , 意大利, 2022-07 作者: Yang GK(杨光开) ; Chenhao(陈皓) ; Junge Zhang(张俊格) ; Qiyue Yin(尹奇跃) ; Kaiqi Huang(黄凯奇)![](/image/person.jpg)
Adobe PDF(2924Kb)  |   收藏  |  浏览/下载:274/59  |  提交时间:2022/07/12 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开 ; 陈皓 ; 张茗奕 ; 尹奇跃 ; 黄凯奇![](/image/person.jpg)
Adobe PDF(1076Kb)  |   收藏  |  浏览/下载:500/85  |  提交时间:2022/07/12 |
| L2E: Learning to Exploit Your Opponent 会议论文 , 意大利 帕多瓦, 2022.07.18-2022.07.23 作者: Wu Zhe ; Li Kai ; Xu Hang; Zang Yifan; An Bo; Xing Junliang![](/image/person.jpg)
Adobe PDF(5676Kb)  |   收藏  |  浏览/下载:213/43  |  提交时间:2022/06/17 |