已选(0)清除
条数/页: 排序方式: |
| 自适应分布式聚合博弈广义纳什均衡算法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220 作者: 时侠圣; 任璐; 孙长银
Adobe PDF(1595Kb)  |   收藏  |  浏览/下载:29/16  |  提交时间:2024/07/02 聚合博弈 自适应 比例积分 梯度跟踪 一般线性多智能体系统 |
| AI资讯 2022年 第07期(总第99期) 其他 2022-07-01 作者: 张桂英![](/image/person.jpg)
Adobe PDF(7409Kb)  |   收藏  |  浏览/下载:18/8  |  提交时间:2024/07/01 |
| 稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文 , 2024 作者: 何少钦![](/image/person.jpg)
Adobe PDF(4570Kb)  |   收藏  |  浏览/下载:58/1  |  提交时间:2024/05/30 强化学习,离线强化学习,空战,智能决策,好奇心机制 |
| 航天器威胁规避智能自主控制技术研究综述 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 229-245 作者: 袁利; 姜甜甜
Adobe PDF(2092Kb)  |   收藏  |  浏览/下载:69/21  |  提交时间:2024/05/09 轨道威胁感知 自主决策规划 “感知-决策-执行”一体化 航天器智能自主控制 |
| 基于终端诱导强化学习的航天器轨道追逃博弈 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984 作者: 耿远卓; 袁利; 黄煌; 汤亮
Adobe PDF(3292Kb)  |   收藏  |  浏览/下载:20/12  |  提交时间:2024/05/09 航天器追逃 智能博弈 近端策略优化 奖励函数设计 终端诱导 |
| 基于距离信息的追逃策略:信念状态连续随机博弈 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 828-840 作者: 陈灵敏; 冯宇; 李永强
Adobe PDF(3110Kb)  |   收藏  |  浏览/下载:61/13  |  提交时间:2024/04/28 追逃问题 信念区域状态 连续随机博弈 马尔科夫决策过程 强化学习 |
| 二人零和动态博弈的自学习平行控制方法研究 学位论文 , 2023 作者: 朱振华![](/image/person.jpg)
Adobe PDF(1737Kb)  |   收藏  |  浏览/下载:185/6  |  提交时间:2023/12/15 自适应动态规划 平行控制 零和博弈 |
| 基于自适应动态规划的最优跟踪控制方法研究 学位论文 , 2023 作者: 王鑫![](/image/person.jpg)
Adobe PDF(6647Kb)  |   收藏  |  浏览/下载:196/11  |  提交时间:2023/06/08 自适应动态规划 输出调节 追逃博弈 最优控制 一致性控制 |
| 基于深度强化学习的群体协同决策关键问题研究 学位论文 , 中国科学院大学: 中国科学院大学人工智能学院, 2021 作者: 王彗木![](/image/person.jpg)
Adobe PDF(8945Kb)  |   收藏  |  浏览/下载:334/1  |  提交时间:2021/06/24 群体系统 协同决策 多智能体系统 深度强化学习 图卷积网络 注 意力机制 |