CASIA OpenIR

浏览/检索结果: 共81条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Exploration via Joint Policy Diversity for Sparse-Reward Multi-Agent Tasks 会议论文
, Macao, China, 2023-8
作者:  Pei Xu;  Junge Zhang;  Kaiqi Huang
Adobe PDF(1369Kb)  |  收藏  |  浏览/下载:204/63  |  提交时间:2023/06/19
Counterfactual Debiasing for Fact Verification 会议论文
, Toronto, Canada, 7.9-7.14, 2023
作者:  Xu WZ(许伟志);  Liu Q(刘强);  Wu S(吴书);  Wang L(王亮)
Adobe PDF(1287Kb)  |  收藏  |  浏览/下载:140/42  |  提交时间:2023/06/26
Dense Attention: A Densely Connected Attention Mechanism for Vision Transformer 会议论文
, Queensland, Australia, June 18 - 23, 2023
作者:  Nannan Li;  Yaran Chen;  Dongbin Zhao
Adobe PDF(3683Kb)  |  收藏  |  浏览/下载:109/33  |  提交时间:2023/06/28
Learning Long- and Short-term Representations for Temporal Knowledge Graph Reasoning 会议论文
, Austin, TX, USA, 2023-4-30
作者:  Mengqi Zhang;  Xuwei Xia;  Qiang Liu;  Shu Wu;  Liang Wang
Adobe PDF(3706Kb)  |  收藏  |  浏览/下载:118/41  |  提交时间:2023/07/03
Pseudo Value Network Distillation for High-Performance Exploration 会议论文
, 澳大利亚, 2023-06
作者:  Zhao EM(赵恩民);  Xing JL(兴军亮);  Li K(李凯);  Kang YX(康永欣);  Tao P(陶品)
Adobe PDF(5874Kb)  |  收藏  |  浏览/下载:118/37  |  提交时间:2023/06/28
基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文
模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312
作者:  关伟凡;  张希
Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:111/36  |  提交时间:2023/06/29
强化学习  模仿学习  噪声对比估计  自适应权重  
Subspace-Aware Exploration for Sparse-Reward Multi-Agent Tasks 会议论文
, Washington DC, USA, 2023-2-7
作者:  Pei Xu;  Junge Zhang;  Qiyue Yin;  Chao Yu;  Yaodong Yang;  Kaiqi Huang
Adobe PDF(2037Kb)  |  收藏  |  浏览/下载:170/58  |  提交时间:2023/06/19
deep reinforcement learning  sparse reward  exploration  multi-agent  
Learning Latent Relations for Temporal Knowledge Graph Reasoning 会议论文
, Toronto, Canada, 2023-7-9
作者:  Mengqi Zhang;  Yuwei Xia;  Qiang Liu;  Shu Wu;  Liang Wang
Adobe PDF(1574Kb)  |  收藏  |  浏览/下载:307/212  |  提交时间:2023/07/03
VLP: A Survey on Vision-language Pre-training 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:  Feilong Chen;  Duzhen Zhang;  Minglun Han;  Xiuyi Chen;  Jing Shi;  Shuang Xu;  Bo Xu
Adobe PDF(969Kb)  |  收藏  |  浏览/下载:111/27  |  提交时间:2023/06/21
Learning to Manipulate Tools Using Deep Reinforcement Learning and Anchor Information 会议论文
, Jinghong, China, 05-09 December 2022
作者:  Junhang Wei;  Shaowei Cui;  Peng Hao;  Shuo Wang
Adobe PDF(933Kb)  |  收藏  |  浏览/下载:125/50  |  提交时间:2023/10/25