CASIA OpenIR

浏览/检索结果: 共247条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
CLUSTER CONSTRAINTBASEDSPARSENMFFORHYPERSPECTRALIMAGERY UNMIXING 会议论文
, 法国巴黎, 10月27-30日
作者:  Jiang XW(蒋心为);  Ma L(马雷);  Yang YP(杨一平)
Adobe PDF(261Kb)  |  收藏  |  浏览/下载:37/17  |  提交时间:2024/06/24
基于基础模型的分层强化学习 学位论文
, 2024
作者:  吴俣桥
Adobe PDF(16716Kb)  |  收藏  |  浏览/下载:43/0  |  提交时间:2024/06/21
强化学习  分层强化学习  基础模型  
Modeling Socially Normative Navigation Behaviors from Demonstrations with Inverse Reinforcement Learning 会议论文
, Vancouver, British Columbia, Canada, 2019-08-22至2019-08-26
作者:  Xingyuan Gao;  Xiaoguang Zhao;  Min Tan
Adobe PDF(1500Kb)  |  收藏  |  浏览/下载:49/18  |  提交时间:2024/06/21
面向服务机器人的社交导航方法研究 学位论文
, 2024
作者:  高星远
Adobe PDF(57102Kb)  |  收藏  |  浏览/下载:106/16  |  提交时间:2024/06/19
服务机器人  社交导航  运动规划  
Discovering Latent Variables for the Tasks With Confounders in Multi-Agent Reinforcement Learning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2024, 卷号: 11, 期号: 7, 页码: 1591-1604
作者:  Kun Jiang;  Wenzhang Liu;  Yuanda Wang;  Lu Dong;  Changyin Sun
Adobe PDF(2128Kb)  |  收藏  |  浏览/下载:51/19  |  提交时间:2024/06/07
Latent variable model  maximum entropy  multi-agent reinforcement learning (MARL)  multi-agent system  
Generative Calibration for In-context Learning 会议论文
, Singapore, 2023-10-6
作者:  Zhongtao Jiang;  Yuanzhe Zhang;  Cao Liu;  Jun Zhao;  Kang Liu
Adobe PDF(763Kb)  |  收藏  |  浏览/下载:50/21  |  提交时间:2024/06/06
基于隐变量模型的自然语言处理解释方法研究 学位论文
, 2024
作者:  江忠涛
Adobe PDF(3157Kb)  |  收藏  |  浏览/下载:57/1  |  提交时间:2024/06/05
解释方法,自然语言处理,隐变量模型  
Boosting On-Policy Actor–Critic With Shallow Updates in Critic 期刊论文
IEEE Transactions on Neural Networks and Learning Systems, 2024, 页码: 1-10
作者:  Luntong Li;  Yuanheng Zhu
Adobe PDF(9953Kb)  |  收藏  |  浏览/下载:58/19  |  提交时间:2024/06/05
MAT: Morphological Adaptive Transformer for Universal Morphology Policy Learning 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 1-12
作者:  Boyu Li;  Haran Li;  Yuanheng Zhu;  Dongbin Zhao
Adobe PDF(9953Kb)  |  收藏  |  浏览/下载:40/12  |  提交时间:2024/06/05
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories 期刊论文
IEEE Communications Surveys and Tutorials, 2024, 页码: 50
作者:  Yang,Ning;  Chen,Shuo;  Zhang,Haijun;  Berry,Randall
Adobe PDF(1694Kb)  |  收藏  |  浏览/下载:63/8  |  提交时间:2024/06/01
Reinforcement learning, mobile edge computing, offloading scheduling, content caching, and communication