CASIA OpenIR

浏览/检索结果: 共326条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Deep Reinforcement Learning-Based Driving Policy at Intersections Utilizing Lane Graph Networks 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 1 - 16
作者:  Liu, Yuqi;  Zhang, Qichao;  Gao, Yinfeng;  Zhao, Dongbin
Adobe PDF(22863Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/06/03
Reinforcement Learning  Autonomous Driving  Intersection Navigating  
Improve the efficiency of deep reinforcement learning through semantic exploration guided by natural language. 会议论文
, 北京华腾美居酒店, 2023-12-9
作者:  Zhourui Guo;  Meng Yao;  Yang Yu;  Qiyue Yin
Adobe PDF(2302Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/06/03
Enhancing efficiency and propulsion in bio-mimetic robotic fish through end-to-end deep reinforcement learning 期刊论文
Physics of Fluids, 2024, 卷号: 36, 期号: 3, 页码: 031910
作者:  Cui,Xinyu;  Sun,Boai;  Zhu,Yi;  Yang,Ning;  Zhang,Haifeng;  Cui,Weicheng;  Fan,Dixia;  Wang,Jun
Adobe PDF(4056Kb)  |  收藏  |  浏览/下载:8/1  |  提交时间:2024/06/02
bio-mimetic robotic fish  deep reinforcement learning  
面向多任务和属性泛化的多智能体强化学习算法研究 学位论文
, 2024
作者:  黄上京
Adobe PDF(15636Kb)  |  收藏  |  浏览/下载:25/1  |  提交时间:2024/06/01
多智能体强化学习  多任务强化学习  多智能体属性组成泛化  实体多机器人平台  
稀疏奖励环境下基于自博弈框架的智能空战算法研究 学位论文
, 2024
作者:  何少钦
Adobe PDF(4570Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
基于目标条件强化学习的无监督技能发现方法研究 学位论文
, 2024
作者:  张天
Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/30
目标  稀疏奖励  无监督强化学习  探索  技能策略  
基于强化学习的电网调度研究 学位论文
, 2024
作者:  王威
Adobe PDF(18647Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/30
电网自动化调度  电网有功出力调度  电网拓扑结构优化  强化学习  
机器人化复合材料自动铺层技术综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 873-897
作者:  郭鹏;  杨辰光;  李祥利;  章艺;  李淼
Adobe PDF(14269Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/05/30
碳纤维增强复合材料  机械臂控制  末端设计  自动铺层  
Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control 会议论文
Advances in Neural Information Processing Systems, New Orleans, USA, 2023-12-10
作者:  Chao Li;  Chen Gong;  Qiang He;  Xinwen Hou
Adobe PDF(1457Kb)  |  收藏  |  浏览/下载:10/2  |  提交时间:2024/05/30