已选(0)清除
条数/页: 排序方式: |
| 扩展目标跟踪中基于深度强化学习的传感器管理方法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431 作者: 张虹芸; 陈辉; 张文旭 Adobe PDF(6523Kb)  |  收藏  |  浏览/下载:33/12  |  提交时间:2024/07/25 传感器管理 扩展目标跟踪 深度强化学习 双延迟深度确定性策略梯度 信息增益 |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:60/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:44/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:44/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| 基于强化学习的多无人机协同任务规划技术 学位论文 , 2024 作者: 张梦瑶 Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:96/0  |  提交时间:2024/07/04 多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 动态资讯 2021年 第06期(总第86期) 其他 2021-06-01 作者: 张桂英 Adobe PDF(7087Kb)  |  收藏  |  浏览/下载:37/18  |  提交时间:2024/07/01 |
| AI资讯 2024年 第06期(总第122期) 其他 2024-06-01 作者: 张桂英 Adobe PDF(8623Kb)  |  收藏  |  浏览/下载:30/15  |  提交时间:2024/07/01 |
| 双足机器人步态生成的研究 学位论文 , 2024 作者: 崔凌志 Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:43/1  |  提交时间:2024/07/01 请双足机器人控制 混合零动力 轨迹自由强化学习 周期性步态奖励机制 动态步态优化 模型融合策略 |
| 基于强化学习的视觉内容生成 学位论文 , 2024 作者: 秦子涵 Adobe PDF(11517Kb)  |  收藏  |  浏览/下载:40/3  |  提交时间:2024/06/26 图像生成 视频生成 强化学习 |