CASIA OpenIR

浏览/检索结果: 共24条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604
作者:  Kun Jiang;  Wenzhang Liu;  Yuanda Wang;  Lu Dong;  Changyin Sun
Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:8/2  |  提交时间:2024/06/07
Latent variable model  maximum entropy  multi-agent reinforcement learning (MARL)  multi-agent system  
类脑心理揣测脉冲神经网络模型研究 学位论文
, 2024
作者:  zhao Zhuo ya
Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/06/04
类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  
组合性感知的弱监督视觉定位研究 学位论文
, 2024
作者:  曾宇楠
Adobe PDF(7681Kb)  |  收藏  |  浏览/下载:31/0  |  提交时间:2024/06/04
视觉定位,视觉语言预训练模型,弱监督,组合性  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:35/1  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
面向多任务和属性泛化的多智能体强化学习算法研究 学位论文
, 2024
作者:  黄上京
Adobe PDF(15636Kb)  |  收藏  |  浏览/下载:35/3  |  提交时间:2024/06/01
多智能体强化学习  多任务强化学习  多智能体属性组成泛化  实体多机器人平台  
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文
IEEE Communications Surveys and Tutorials, 2024, 页码: 50
作者:  Yang,Ning;  Chen,Shuo;  Zhang,Haijun;  Berry,Randall
Adobe PDF(1694Kb)  |  收藏  |  浏览/下载:24/0  |  提交时间:2024/06/01
Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:35/1  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39071Kb)  |  收藏  |  浏览/下载:31/3  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
域偏移场景下的视觉识别方法研究 学位论文
, 2024
作者:  李经纬
Adobe PDF(12161Kb)  |  收藏  |  浏览/下载:16/2  |  提交时间:2024/05/29
迁移学习  视觉识别  无监督域自适应  域泛化  测试时间自适应  
事件因果关系挖掘关键技术研究 学位论文
, 2024
作者:  何致涛
Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:33/1  |  提交时间:2024/05/28
事件因果关系识别  事件因果关系解释生成  预训练语言模型  多智能体