CASIA OpenIR

浏览/检索结果: 共50条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
面向多智能体协作的注意力意图与交流学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325
作者:  俞文武;  杨晓亚;  李海昌;  王瑞;  胡晓惠
Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/04/18
多智能体  强化学习  意图交流  注意力机制  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:24/6  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41
作者:  张振国;  毛建旭;  谭浩然;  王耀南;  张雪波;  江一鸣
Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:5/1  |  提交时间:2024/04/12
重大装备制造  多机器人  任务分配  运动规划  
柔性波动鳍推进水下机器人设计与学习控制 学位论文
, 2023
作者:  马睿宸
Adobe PDF(51754Kb)  |  收藏  |  浏览/下载:128/9  |  提交时间:2023/07/31
波动推进  仿生水下机器人  位姿控制  路径跟踪控制  强化学习  
基于图表示学习的股票市场预测方法研究 学位论文
, 2023
作者:  田虎
Adobe PDF(6717Kb)  |  收藏  |  浏览/下载:175/12  |  提交时间:2023/07/03
股票市场预测  图表示学习  金融复杂网络  股票关联  股票分析师  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:143/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:368/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统  
仿生推进水下作业机器人自主运动控制研究 学位论文
, 2023
作者:  吕家启
Adobe PDF(8590Kb)  |  收藏  |  浏览/下载:209/10  |  提交时间:2023/06/19
仿生推进  水下作业机器人  水下避障  抗扰趋近控制  姿态控制  自主作业  
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
, 2023
作者:  白云鹏
Adobe PDF(36141Kb)  |  收藏  |  浏览/下载:150/9  |  提交时间:2023/06/13
多智能体,强化学习,超图,变分推断,好奇心