CASIA OpenIR

浏览/检索结果: 共17条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于目标条件强化学习的无监督技能发现方法研究 学位论文
, 2024
作者:  张天
Adobe PDF(13799Kb)  |  收藏  |  浏览/下载:14/0  |  提交时间:2024/05/30
目标  稀疏奖励  无监督强化学习  探索  技能策略  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
灵巧手机器人的类人物体交接学习研究 学位论文
, 2024
作者:  段昊男
Adobe PDF(51787Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/29
机器人学习  人机交互  物体交接  灵巧手机器人  
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:18/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
面向平行交通系统的城市交通控制基础模型关键技术 学位论文
, 2024
作者:  赵宸
Adobe PDF(6234Kb)  |  收藏  |  浏览/下载:24/1  |  提交时间:2024/05/27
平行交通系统  交通控制  平行学习  强化学习  基础模型  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:17/5  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Collective Movement Simulation: Methods and Applications 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 452-480
作者:  Hua Wang;  Xing-Yu Guo;  Hao Tao;  Ming-Liang Xu
Adobe PDF(1439Kb)  |  收藏  |  浏览/下载:13/7  |  提交时间:2024/05/23
Collective movement simulation, multiple objects, multiple discipline, simulation effect, collective intelligence  
A Two-layer Encoding Learning Swarm Optimizer based on Frequent Itemsets for Sparse Large-scale Multi-objective Optimization 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 6, 页码: 1342-1357
作者:  Sheng Qi;  Rui Wang;  Tao Zhang;  Xu Yang;  Ruiqing Sun;  Ling Wang
Adobe PDF(3038Kb)  |  收藏  |  浏览/下载:14/4  |  提交时间:2024/05/22
Evolutionary algorithms  learning swarm optimization  sparse large-scale optimization  sparse large-scale multi-objective problems  two-layer encoding  
针对身份证文本识别的黑盒攻击算法研究 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 103-120
作者:  徐昌凯;  冯卫栋;  张淳杰;  郑晓龙;  张辉;  王飞跃
Adobe PDF(20872Kb)  |  收藏  |  浏览/下载:56/21  |  提交时间:2024/04/12
对抗样本  黑盒攻击  身份证文本识别  物理世界  二值化掩码