CASIA OpenIR

浏览/检索结果: 共965条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning State-Specific Action Masks for Reinforcement Learning 期刊论文
Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60
作者:  Wang ZY(王梓薏);  Li XR(李欣然);  Sun LY(孙罗洋);  Zhang HF(张海峰);  Liu HL(刘华林);  Jun Wang
Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:16/6  |  提交时间:2024/07/05
reinforcement learning  exploration efficiency  space reduction  
An Improved Minimax-Q Algorithm Based on Generalized Policy Iteration to Solve a Chaser-Invader Game 会议论文
, 线上, 2020-5
作者:  Liu MS(刘民颂);  Zhu YH(朱圆恒);  Zhao DB(赵冬斌)
Adobe PDF(727Kb)  |  收藏  |  浏览/下载:15/7  |  提交时间:2024/07/04
基于强化学习动作空间精简的时序决策任务算法研究 学位论文
, 2024
作者:  王梓薏
Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04
时序决策  强化学习  动作空间约简  分层强化学习  动作掩码  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:38/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10
作者:  Li, Luntong;  Zhu, Yuanheng
收藏  |  浏览/下载:6/0  |  提交时间:2024/07/03
Artificial neural networks  Vectors  Task analysis  Training  Representation learning  Approximation algorithms  Optimization  Actor-critic  deep reinforcement learning (DRL)  proximal policy optimization (PPO)  shallow reinforcement learning (SRL)  
Modeling and Mitigating the Cycle Aging Cost of Vehicle Batteries in Energy Transportation Nexus 期刊论文
IEEE TRANSACTIONS ON SMART GRID, 2024, 卷号: 15, 期号: 2, 页码: 1902-1912
作者:  Li, Shuangqi;  Zhao, Pengfei;  Gu, Chenghong;  Bu, Siqi;  Li, Jianwei;  Cheng, Shuang
收藏  |  浏览/下载:1/0  |  提交时间:2024/07/03
Batteries  Aging  Degradation  Energy management  Mathematical models  Vehicle-to-grid  Computational modeling  Electric vehicle  battery management  hybrid vehicle energy management  vehicle grid integration  battery aging mechanism  priority experience  imitative learning  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
动态资讯 2021年 第10期(总第90期) 其他
2021-10-01
作者:  张桂英
Adobe PDF(5621Kb)  |  收藏  |  浏览/下载:19/6  |  提交时间:2024/07/01
AI资讯 2023年 第03期(总第107期) 其他
2023-03-01
作者:  张桂英
Adobe PDF(3134Kb)  |  收藏  |  浏览/下载:3/2  |  提交时间:2024/07/01