已选(0)清除
条数/页: 排序方式: |
| D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文 , 中国重庆, 2024-5-7 作者: Niu LY(钮龙宇); Wan J(万军) Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/28 |
| 多智能体策略一致性奖励塑造算法研究 学位论文 , 2024 作者: 杨晨 Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/27 多智能体系统 深度强化学习 信用分配 奖励塑造 |
| 视觉自监督学习关键技术研究 学位论文 , 2024 作者: 李朝闻 Adobe PDF(42567Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/27 请输入关键词 |
| 推理机制启发的视觉语言导航 学位论文 , 2024 作者: 安东 Adobe PDF(10930Kb)  |  收藏  |  浏览/下载:18/2  |  提交时间:2024/05/27 视觉语言导航 模块化推理 认知地图 子目标导航 |
| 分层强化学习的子目标生成与探索策略 学位论文 , 2024 作者: 王开申 Adobe PDF(8335Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/05/27 分层强化学习,子目标生成,互信息,扩散模型 |
| 面向平行交通系统的城市交通控制基础模型关键技术 学位论文 , 2024 作者: 赵宸 Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:14/1  |  提交时间:2024/05/27 平行交通系统 交通控制 平行学习 强化学习 基础模型 |
| 基于精细运动想象范式的机械臂控制系统设计与研究 学位论文 , 2024 作者: 王宇 Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:23/0  |  提交时间:2024/05/27 脑-机接口 运动想象 机械臂控制系统 单侧肢体 机器学习 |
| Optimal Strategy for Aircraft Pursuit-evasion Games via Self-play Iteration 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 585-596 作者: Xin Wang; Qing-Lai Wei; Tao Li; Jie Zhang Adobe PDF(1750Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/05/23 Differential games, pursuit-evasion games, nonlinear control, optimal control, Nash equilibrium solution |
| Generalized Embedding Machines for Recommender Systems 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 571-584 作者: Enneng Yang; Xin Xin; Li Shen; Yudong Luo; Guibing Guo Adobe PDF(1617Kb)  |  收藏  |  浏览/下载:13/6  |  提交时间:2024/05/23 Feature interactions, high-order interaction, factorization machine (FM), recommender system, graph neural network (GNN) |
| An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文 Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570 作者: Yan Song; He Jiang; Zheng Tian; Haifeng Zhang; Yingping Zhang; Jiangcheng Zhu; Zonghong Dai; Weinan Zhang; Jun Wang Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:12/5  |  提交时间:2024/05/23 Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory |