已选(0)清除
条数/页: 排序方式: |
| 面向多智能体协作的注意力意图与交流学习方法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325 作者: 俞文武; 杨晓亚; 李海昌; 王瑞; 胡晓惠 Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/04/18 多智能体 强化学习 意图交流 注意力机制 |
| 异策略深度强化学习中的经验回放研究综述 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256 作者: 胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/18 深度强化学习 异策略 经验回放 人工智能 |
| 基于优先采样模型的离线强化学习 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:24/6  |  提交时间:2024/04/12 离线强化学习 优先采样模型 时序差分误差 鞅 批约束深度Q学习 |
| 重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41 作者: 张振国; 毛建旭; 谭浩然; 王耀南; 张雪波; 江一鸣 Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:5/1  |  提交时间:2024/04/12 重大装备制造 多机器人 任务分配 运动规划 |
| 柔性波动鳍推进水下机器人设计与学习控制 学位论文 , 2023 作者: 马睿宸 Adobe PDF(51754Kb)  |  收藏  |  浏览/下载:128/9  |  提交时间:2023/07/31 波动推进 仿生水下机器人 位姿控制 路径跟踪控制 强化学习 |
| 基于图表示学习的股票市场预测方法研究 学位论文 , 2023 作者: 田虎 Adobe PDF(6717Kb)  |  收藏  |  浏览/下载:175/12  |  提交时间:2023/07/03 股票市场预测 图表示学习 金融复杂网络 股票关联 股票分析师 |
| 基于深度强化学习的超车换道决策方法 学位论文 , 2023 作者: 王俊杰 Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:143/3  |  提交时间:2023/06/26 深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化 |
| 基于深度强化学习的连续动作空中博弈对抗决策 学位论文 , 2023 作者: 李伟凡 Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:368/18  |  提交时间:2023/06/26 强化学习 深度强化学习 自注意力网络 智能决策 多智能体系统 |
| 仿生推进水下作业机器人自主运动控制研究 学位论文 , 2023 作者: 吕家启 Adobe PDF(8590Kb)  |  收藏  |  浏览/下载:209/10  |  提交时间:2023/06/19 仿生推进 水下作业机器人 水下避障 抗扰趋近控制 姿态控制 自主作业 |
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 , 2023 作者: 白云鹏 Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:150/9  |  提交时间:2023/06/13 多智能体,强化学习,超图,变分推断,好奇心 |