已选(0)清除
条数/页: 排序方式: |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| 基于电磁叠加方法的便携式神经调控技术研究 学位论文 , 2024 作者: 戚自辉 Adobe PDF(9884Kb)  |  收藏  |  浏览/下载:17/0  |  提交时间:2024/07/09 经颅磁刺激,经颅电刺激,电磁叠加,便携,聚焦 |
| 标注受限的光学遥感图像目标检测模型与算法研究 学位论文 , 2024 作者: 任至达 Adobe PDF(18136Kb)  |  收藏  |  浏览/下载:15/0  |  提交时间:2024/07/08 光学遥感图像目标检测 标注受限 弱监督学习 显著性检测 特征增强 |
| Autonomous Driving in Underground Mines via Parallel Driving Operation Systems: Challenges, Frameworks and Cases Study 期刊论文 IEEE Transactions on Intelligent Vehicles, 2024, 页码: 1-10 作者: Bin Tian; Caiji Zhang; Xuedi Hao; Shi Meng; Shibin Wang; Zheng Yang; Long Chen; Yanlong Zhao; Shirong Ge Adobe PDF(11335Kb)  |  收藏  |  浏览/下载:41/3  |  提交时间:2024/07/05 |
| Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:14/6  |  提交时间:2024/07/05 reinforcement learning exploration efficiency space reduction |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| D-PBS: Dueling Priority-Based Search for Multiple Nonholonomic Robots Motion Planning in Congested Environments 期刊论文 IEEE ROBOTICS AND AUTOMATION LETTERS, 2024, 卷号: 9, 期号: 7, 页码: 6288-6295 作者: Zhang, Xiaotong; Xiong, Gang; Wang, Yuanjing; Teng, Siyu; Chen, Long 收藏  |  浏览/下载:4/0  |  提交时间:2024/07/04 Multi-robot system motion planning nonholonomic robot |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 面向算力网络的智慧调度综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103 作者: 李逸博; 李小平; 王爽; 蒋嶷川 Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/07/02 算力网络 云计算 边缘计算 资源调度 知识 |