已选(0)清除
条数/页: 排序方式: |
| QFuture: Learning Future Expectation Cognition in Multi-Agent Reinforcement Learning 期刊论文 IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 12 作者: Liu BY(刘博寅) Adobe PDF(6675Kb)  |  收藏  |  浏览/下载:13/2  |  提交时间:2024/07/12 |
| 基于深度强化学习的足球智能体球员策略方法研究 学位论文 , 2024 作者: 刘博寅 Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:17/0  |  提交时间:2024/07/12 足球 多智能体系统 深度强化学习 互信息 内在激励 预训练 |
| Parallel Data and Foundation Model Driven Closed-Loop of Autonomous Driving 会议论文 , Edmonton, Canada, SEP 24-27, 2024 作者: Bin Tian; Tingting Yao; Yisheng Lv; Shichao Chen; Yang Sun; Ruiqi Song Adobe PDF(5420Kb)  |  收藏  |  浏览/下载:40/10  |  提交时间:2024/07/10 |
| Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文 , Chengdu, China, 2021-10 作者: Zhang X(张熙); Feifei Zhang; Changsheng Xu Adobe PDF(5740Kb)  |  收藏  |  浏览/下载:29/7  |  提交时间:2024/07/08 |
| 面向多模态语义理解与推理的视觉问答研究 学位论文 , 2024 作者: 张熙 Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:21/2  |  提交时间:2024/07/08 多模态 视觉问答 语义挖掘 可靠关联 推理泛化 |
| 基于多模态协同的驾驶行为预测 学位论文 , 2024 作者: 董清辉 Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:20/0  |  提交时间:2024/07/08 人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习 |
| Deep Survival Analysis With Latent Clustering and Contrastive Learning 期刊论文 IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS, 2024, 卷号: 28, 期号: 5, 页码: 3090-3101 作者: Cui, Chang; Tang, Yongqiang; Zhang, Wensheng 收藏  |  浏览/下载:3/0  |  提交时间:2024/07/04 Analytical models Task analysis Self-supervised learning Predictive models Hazards Data models Correlation Survival analysis deep learning clustering contrastive learning survival prediction |
| 基于多变量时空融合网络的风机数据缺失值插补研究 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1171-1184 作者: 詹兆康; 胡旭光; 赵浩然; 张思琪; 张峻凯; 马大中 Adobe PDF(8391Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02 风机数据 数据插补 时空特征 生成对抗网络 |
| 基于表征学习的离线强化学习方法研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128 作者: 王雪松; 王荣荣; 程玉虎 Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:12/8  |  提交时间:2024/07/02 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移 |
| 双足机器人步态生成的研究 学位论文 , 2024 作者: 崔凌志 Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:26/1  |  提交时间:2024/07/01 请双足机器人控制 混合零动力 轨迹自由强化学习 周期性步态奖励机制 动态步态优化 模型融合策略 |