CASIA OpenIR

浏览/检索结果: 共82条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:31/7  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41
作者:  张振国;  毛建旭;  谭浩然;  王耀南;  张雪波;  江一鸣
Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:7/2  |  提交时间:2024/04/12
重大装备制造  多机器人  任务分配  运动规划  
基于深层卷积随机配置网络的电熔镁炉工况识别方法研究 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 527-543
作者:  李帷韬;  童倩倩;  王殿辉;  吴高昌
Adobe PDF(7244Kb)  |  收藏  |  浏览/下载:14/6  |  提交时间:2024/04/10
电熔镁炉  深层卷积随机配置网络  高斯差分卷积核  类激活映射图  可解释性  
受脑启发的多任务域小样本连续学习方法研究 学位论文
, 2023
作者:  商迪
Adobe PDF(1921Kb)  |  收藏  |  浏览/下载:142/5  |  提交时间:2023/08/31
连续学习,小样本学习,多任务域学习,类脑计算,目标检测  
结合经济生态约束的“区域-农户”种植规划研究 学位论文
, 2023
作者:  许钰林
Adobe PDF(2700Kb)  |  收藏  |  浏览/下载:91/2  |  提交时间:2023/07/03
种植规划  扩种大豆  农作物价格预测  粒子群算法  强化学习  
全局信息指导下的分布式多智能体协作算法研究 学位论文
, 2023
作者:  陈逸群
Adobe PDF(42245Kb)  |  收藏  |  浏览/下载:85/2  |  提交时间:2023/06/27
强化学习,多智能体协作,全局信息,知识蒸馏  
融合信息素机制的大规模多智能体协同技术 学位论文
, 2023
作者:  JiaHui Zhang
Adobe PDF(5936Kb)  |  收藏  |  浏览/下载:153/3  |  提交时间:2023/06/26
大规模多智能体协同  多智能体强化学习  信息素机制  知识蒸馏  
基于深度强化学习的超车换道决策方法 学位论文
, 2023
作者:  王俊杰
Adobe PDF(17475Kb)  |  收藏  |  浏览/下载:146/3  |  提交时间:2023/06/26
深度强化学习,自动驾驶,换道决策,基于模型值扩展,动力学泛化  
基于深度强化学习的连续动作空中博弈对抗决策 学位论文
, 2023
作者:  李伟凡
Adobe PDF(43167Kb)  |  收藏  |  浏览/下载:372/18  |  提交时间:2023/06/26
强化学习  深度强化学习  自注意力网络  智能决策  多智能体系统