已选(0)清除
条数/页: 排序方式: |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(6675Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/07/12 |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| 面向狭小空间涂胶作业的机器人设计及规划感知技术研究 学位论文 , 2024 作者: 章澳顺 Adobe PDF(65020Kb)  |  收藏  |  浏览/下载:15/0  |  提交时间:2024/07/11 超冗余度蛇形机械臂 运动规划 视觉定位 缺陷检测 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:16/1  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/07/05 reinforcement learning exploration efficiency space reduction |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:31/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政 Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| Design, Optimization, and Modeling of a Hydraulic Soft Robot for Chronic Total Occlusions 期刊论文 BIOMIMETICS, 2024, 卷号: 9, 期号: 3, 页码: 17 作者: Meng, Ling-Wu; Xie, Xiao-Liang; Zhou, Xiao-Hu; Liu, Shi-Qi; Hou, Zeng-Guang 收藏  |  浏览/下载:1/0  |  提交时间:2024/07/03 CTO soft hydraulic robot structure optimization kinematic model fluid-structure interaction |
| A Bio-Inspired Integration Model of Basal Ganglia and Cerebellum for Motion Learning of a Musculoskeletal Robot 期刊论文 JOURNAL OF SYSTEMS SCIENCE & COMPLEXITY, 2024, 卷号: 37, 期号: 1, 页码: 82-113 作者: Zhang, Jinhan; Chen, Jiahao; Zhong, Shanlin; Qiao, Hong 收藏  |  浏览/下载:3/0  |  提交时间:2024/07/03 Basal ganglia and cerebellum bio-inspired integration model motion learning muscu-loskeletal robot reinforcement learning |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |