CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:39/10  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文
模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312
作者:  关伟凡;  张希
Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:118/39  |  提交时间:2023/06/29
强化学习  模仿学习  噪声对比估计  自适应权重  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:9/3  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
面向多智能体协作的注意力意图与交流学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325
作者:  俞文武;  杨晓亚;  李海昌;  王瑞;  胡晓惠
Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:16/8  |  提交时间:2024/04/18
多智能体  强化学习  意图交流  注意力机制  
基于滚动时域强化学习的智能车辆侧向控制算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 12, 页码: 2481-2492
作者:  张兴龙;  陆阳;  李文璋;  徐昕
Adobe PDF(7533Kb)  |  收藏  |  浏览/下载:6/1  |  提交时间:2024/04/17
滚动时域  强化学习  智能汽车  侧向控制  
面向无人艇的T-DQN智能避障算法研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1645-1655
作者:  周治国;  余思雨;  于家宝;  段俊伟;  陈龙;  陈俊龙
Adobe PDF(6392Kb)  |  收藏  |  浏览/下载:5/3  |  提交时间:2024/04/24
无人艇  强化学习  智能避障  深度Q网络  
基于强化学习的减少烘丝过程中烟丝“干头”量的方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1679-1687
作者:  毕素环;  蒋一翔;  于树松;  丁香乾;  牟亮亮;  王彬
Adobe PDF(1955Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/04/24
烟丝含水率  过干烟丝  强化学习  超调  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
支持重规划的战时保障动态调度研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 7, 页码: 1519-1529
作者:  曾斌;  樊旭;  李厚朴
Adobe PDF(1581Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/04/25
战时保障  重规划  马尔科夫决策过程  动态调度  强化学习  
基于强化学习的波动鳍推进水下作业机器人悬停控制 期刊论文
控制理论与应用, 2022, 卷号: 39, 期号: 11, 页码: 2022-2099
作者:  马睿宸;  白雪剑;  王宇;  王睿;  王硕
Adobe PDF(5386Kb)  |  收藏  |  浏览/下载:104/42  |  提交时间:2023/08/02
水下作业机器人  悬停控制  波动鳍  神经网络  强化学习