已选(0)清除
条数/页: 排序方式: |
| Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604 作者: Kun Jiang; Wenzhang Liu; Yuanda Wang; Lu Dong; Changyin Sun Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/06/07 Latent variable model maximum entropy multi-agent reinforcement learning (MARL) multi-agent system |
| 类脑心理揣测脉冲神经网络模型研究 学位论文 , 2024 作者: zhao Zhuo ya Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/06/04 类脑心理揣测模型 脉冲神经网络 多智能体社会交互 区分自我和他人 |
| 表示增强的深度强化学习算法研究 学位论文 , 2024 作者: 张清扬 Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/06/04 请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型 |
| Deep Reinforcement Learning-Based Driving Policy at Intersections Utilizing Lane Graph Networks 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 1 - 16 作者: Liu, Yuqi; Zhang, Qichao; Gao, Yinfeng; Zhao, Dongbin Adobe PDF(22863Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/06/03 Reinforcement Learning Autonomous Driving Intersection Navigating |
| 基于目标条件强化学习的无监督技能发现方法研究 学位论文 , 2024 作者: 张天 Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/30 目标 稀疏奖励 无监督强化学习 探索 技能策略 |
| Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control 会议论文 Advances in Neural Information Processing Systems, New Orleans, USA, 2023-12-10 作者: Chao Li; Chen Gong; Qiang He; Xinwen Hou Adobe PDF(1457Kb)  |  收藏  |  浏览/下载:12/3  |  提交时间:2024/05/30 |
| 连续控制任务中集成策略的多样性探索研究 学位论文 , 2024 作者: 李超 Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:14/1  |  提交时间:2024/05/28 强化学习 集成学习 价值估计 多样性探索 |
| Collective Movement Simulation: Methods and Applications 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 452-480 作者: Hua Wang; Xing-Yu Guo; Hao Tao; Ming-Liang Xu Adobe PDF(1439Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/05/23 Collective movement simulation, multiple objects, multiple discipline, simulation effect, collective intelligence |
| 面向无人艇的T-DQN智能避障算法研究 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1645-1655 作者: 周治国; 余思雨; 于家宝; 段俊伟; 陈龙; 陈俊龙 Adobe PDF(6392Kb)  |  收藏  |  浏览/下载:29/8  |  提交时间:2024/04/24 无人艇 强化学习 智能避障 深度Q网络 |
| Communication Resource-Efficient Vehicle Platooning Control With Various Spacing Policies 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 2, 页码: 362-376 作者: Xiaohua Ge; Qing-Long Han; Xian-Ming Zhang; Derui Ding Adobe PDF(3378Kb)  |  收藏  |  浏览/下载:83/33  |  提交时间:2024/01/23 Automated vehicles constant time headway spacing constant spacing cooperative adaptive cruise control event-triggered communication vehicle platooning |