CASIA OpenIR

浏览/检索结果: 共43条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604
作者:  Kun Jiang;  Wenzhang Liu;  Yuanda Wang;  Lu Dong;  Changyin Sun
Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/06/07
Latent variable model  maximum entropy  multi-agent reinforcement learning (MARL)  multi-agent system  
类脑心理揣测脉冲神经网络模型研究 学位论文
, 2024
作者:  zhao Zhuo ya
Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/06/04
类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
Deep Reinforcement Learning-Based Driving Policy at Intersections Utilizing Lane Graph Networks 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 1 - 16
作者:  Liu, Yuqi;  Zhang, Qichao;  Gao, Yinfeng;  Zhao, Dongbin
Adobe PDF(22863Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/06/03
Reinforcement Learning  Autonomous Driving  Intersection Navigating  
基于目标条件强化学习的无监督技能发现方法研究 学位论文
, 2024
作者:  张天
Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/30
目标  稀疏奖励  无监督强化学习  探索  技能策略  
Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control 会议论文
Advances in Neural Information Processing Systems, New Orleans, USA, 2023-12-10
作者:  Chao Li;  Chen Gong;  Qiang He;  Xinwen Hou
Adobe PDF(1457Kb)  |  收藏  |  浏览/下载:12/3  |  提交时间:2024/05/30
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:14/1  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
Collective Movement Simulation: Methods and Applications 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 452-480
作者:  Hua Wang;  Xing-Yu Guo;  Hao Tao;  Ming-Liang Xu
Adobe PDF(1439Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/05/23
Collective movement simulation, multiple objects, multiple discipline, simulation effect, collective intelligence  
面向无人艇的T-DQN智能避障算法研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1645-1655
作者:  周治国;  余思雨;  于家宝;  段俊伟;  陈龙;  陈俊龙
Adobe PDF(6392Kb)  |  收藏  |  浏览/下载:29/8  |  提交时间:2024/04/24
无人艇  强化学习  智能避障  深度Q网络  
Communication Resource-Efficient Vehicle Platooning Control With Various Spacing Policies 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 2, 页码: 362-376
作者:  Xiaohua Ge;  Qing-Long Han;  Xian-Ming Zhang;  Derui Ding
Adobe PDF(3378Kb)  |  收藏  |  浏览/下载:83/33  |  提交时间:2024/01/23
Automated vehicles  constant time headway spacing  constant spacing  cooperative adaptive cruise control  event-triggered communication  vehicle platooning