CASIA OpenIR

浏览/检索结果: 共1362条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
, 中国重庆, 2024-5-7
作者:  Niu LY(钮龙宇);  Wan J(万军)
Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/28
多智能体策略一致性奖励塑造算法研究 学位论文
, 2024
作者:  杨晨
Adobe PDF(6011Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/27
多智能体系统  深度强化学习  信用分配  奖励塑造  
视觉自监督学习关键技术研究 学位论文
, 2024
作者:  李朝闻
Adobe PDF(42567Kb)  |  收藏  |  浏览/下载:16/0  |  提交时间:2024/05/27
请输入关键词  
推理机制启发的视觉语言导航 学位论文
, 2024
作者:  安东
Adobe PDF(10930Kb)  |  收藏  |  浏览/下载:18/2  |  提交时间:2024/05/27
视觉语言导航  模块化推理  认知地图  子目标导航  
分层强化学习的子目标生成与探索策略 学位论文
, 2024
作者:  王开申
Adobe PDF(8335Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/05/27
分层强化学习,子目标生成,互信息,扩散模型  
面向平行交通系统的城市交通控制基础模型关键技术 学位论文
, 2024
作者:  赵宸
Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:14/1  |  提交时间:2024/05/27
平行交通系统  交通控制  平行学习  强化学习  基础模型  
基于精细运动想象范式的机械臂控制系统设计与研究 学位论文
, 2024
作者:  王宇
Adobe PDF(3839Kb)  |  收藏  |  浏览/下载:23/0  |  提交时间:2024/05/27
脑-机接口  运动想象  机械臂控制系统  单侧肢体  机器学习  
Optimal Strategy for Aircraft Pursuit-evasion Games via Self-play Iteration 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 585-596
作者:  Xin Wang;  Qing-Lai Wei;  Tao Li;  Jie Zhang
Adobe PDF(1750Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/05/23
Differential games, pursuit-evasion games, nonlinear control, optimal control, Nash equilibrium solution  
Generalized Embedding Machines for Recommender Systems 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 571-584
作者:  Enneng Yang;  Xin Xin;  Li Shen;  Yudong Luo;  Guibing Guo
Adobe PDF(1617Kb)  |  收藏  |  浏览/下载:13/6  |  提交时间:2024/05/23
Feature interactions, high-order interaction, factorization machine (FM), recommender system, graph neural network (GNN)  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:12/5  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory