CASIA OpenIR

浏览/检索结果: 共136条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
扩展目标跟踪中基于深度强化学习的传感器管理方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431
作者:  张虹芸;  陈辉;  张文旭
Adobe PDF(6523Kb)  |  收藏  |  浏览/下载:33/12  |  提交时间:2024/07/25
传感器管理  扩展目标跟踪  深度强化学习  双延迟深度确定性策略梯度  信息增益  
基于深度强化学习的足球智能体球员策略方法研究 学位论文
, 2024
作者:  刘博寅
Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:60/0  |  提交时间:2024/07/12
足球  多智能体系统  深度强化学习  互信息  内在激励  预训练  
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:44/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:44/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:96/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
动态资讯 2021年 第06期(总第86期) 其他
2021-06-01
作者:  张桂英
Adobe PDF(7087Kb)  |  收藏  |  浏览/下载:37/18  |  提交时间:2024/07/01
AI资讯 2024年 第06期(总第122期) 其他
2024-06-01
作者:  张桂英
Adobe PDF(8623Kb)  |  收藏  |  浏览/下载:30/15  |  提交时间:2024/07/01
双足机器人步态生成的研究 学位论文
, 2024
作者:  崔凌志
Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:43/1  |  提交时间:2024/07/01
请双足机器人控制  混合零动力  轨迹自由强化学习  周期性步态奖励机制  动态步态优化  模型融合策略  
基于强化学习的视觉内容生成 学位论文
, 2024
作者:  秦子涵
Adobe PDF(11517Kb)  |  收藏  |  浏览/下载:40/3  |  提交时间:2024/06/26
图像生成  视频生成  强化学习