已选(0)清除
条数/页: 排序方式: |
| Learning to Play Football from Sports Perspective: A Knowledge-embedded Deep Reinforcement Learning Framework 期刊论文 IEEE Transactions on Games, 2022, 页码: 12 作者: Liu BY(刘博寅)![](/image/person.jpg)
Adobe PDF(2957Kb)  |   收藏  |  浏览/下载:17/5  |  提交时间:2024/07/12 |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅)![](/image/person.jpg)
Adobe PDF(6675Kb)  |   收藏  |  浏览/下载:13/2  |  提交时间:2024/07/12 |
| VQACL: A Novel Visual Question Answering Continual Learning Setting 会议论文 , Canada, 2023 作者: Zhang X(张熙) ; Feifei Zhang; Changsheng Xu![](/image/person.jpg)
Adobe PDF(1199Kb)  |   收藏  |  浏览/下载:23/6  |  提交时间:2024/07/08 |
| Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏) ; Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林); Jun Wang
Adobe PDF(2976Kb)  |   收藏  |  浏览/下载:24/12  |  提交时间:2024/07/05 reinforcement learning exploration efficiency space reduction |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:35/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 知识和数据驱动的污水处理反硝化脱氮过程协同优化控制 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1221-1233 作者: 韩红桂; 王玉爽; 刘峥; 孙浩源; 乔俊飞
Adobe PDF(3356Kb)  |   收藏  |  浏览/下载:25/12  |  提交时间:2024/07/02 污水处理反硝化脱氮过程 知识和数据驱动 协同优化控制 自适应知识核函数 知识引导的协同优化算法 |
| 自适应分布式聚合博弈广义纳什均衡算法 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220 作者: 时侠圣; 任璐; 孙长银
Adobe PDF(1595Kb)  |   收藏  |  浏览/下载:14/6  |  提交时间:2024/07/02 聚合博弈 自适应 比例积分 梯度跟踪 一般线性多智能体系统 |
| 高超声速飞行器指定时间时变高增益反馈跟踪控制 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1151-1159 作者: 张康康; 周彬; 蔡光斌; 侯明哲
Adobe PDF(1479Kb)  |   收藏  |  浏览/下载:23/12  |  提交时间:2024/07/02 高超声速飞行器 指定时间控制 时变反馈 高增益反馈 非线性控制 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎
Adobe PDF(3333Kb)  |   收藏  |  浏览/下载:11/7  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| Gait Learning for 3D Bipedal Robots Based on a Combined Strategy of Hybrid Zero Dynamics Feedback Control and Periodic Reward 会议论文 , 中国湖南长沙, 2024-5-25 作者: Cui LZ(崔凌志) ; Tianqi Deng; Lihua Ma; Wenhao He
Adobe PDF(690Kb)  |   收藏  |  浏览/下载:24/9  |  提交时间:2024/07/01 |