CASIA OpenIR

浏览/检索结果: 共258条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Learning Top-K Subtask Planning Tree Based on Discriminative Representation Pretraining for Decision-making 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 782-800
作者:  Jingqing Ruan;   Kaishen Wang;   Qingyang Zhang;   Dengpeng Xing;   Bo Xu
Adobe PDF(4577Kb)  |  收藏  |  浏览/下载:27/12  |  提交时间:2024/07/18
Reinforcement learning  representation learning  subtask planning  task decomposition  pretraining.  
TextFormer: A Query-based End-to-end Text Spotter with Mixed Supervision 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 704-717
作者:  Yukun Zhai;   Xiaoqiang Zhang;   Xiameng Qin;   Sanyuan Zhao;  Xingping Dong;   Jianbing Shen
Adobe PDF(2312Kb)  |  收藏  |  浏览/下载:26/8  |  提交时间:2024/07/18
End-to-end text spotting  arbitrarily-shaped texts  transformer  mixed supervision  multitask modeling  
A Novel Divide and Conquer Solution for Long-term Video Salient Object Detection 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 4, 页码: 684-703
作者:  Yun-Xiao Li;  Cheng-Li-Zhao Chen;   Shuai Li;   Ai-Min Hao;  Hong Qin
Adobe PDF(6454Kb)  |  收藏  |  浏览/下载:28/10  |  提交时间:2024/07/18
Video salient object detection  background consistency analysis  weakly supervised learning  long-term information  background shift  
面向视觉-语言的跨模态预训练与匹配方法研究 学位论文
, 2024
作者:  chen yuxin
Adobe PDF(46981Kb)  |  收藏  |  浏览/下载:35/2  |  提交时间:2024/07/11
视觉语言匹配  图像文本预训练  知识蒸馏  双向匹配评估  令牌合并  
Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning 会议论文
, Chengdu, China, 2021-10
作者:  Zhang X(张熙);  Feifei Zhang;  Changsheng Xu
Adobe PDF(5740Kb)  |  收藏  |  浏览/下载:40/9  |  提交时间:2024/07/08
面向多模态语义理解与推理的视觉问答研究 学位论文
, 2024
作者:  张熙
Adobe PDF(39126Kb)  |  收藏  |  浏览/下载:54/2  |  提交时间:2024/07/08
多模态  视觉问答  语义挖掘  可靠关联  推理泛化  
CMFN: Cross-Modal Fusion Network for Irregular Scene Text Recognition 会议论文
, 中国, 2023.06.08
作者:  Jinzhi Zheng;  Ruyi Ji;  Libo Zhang;  Yanjun Wu;  Chen Zhao
Adobe PDF(1516Kb)  |  收藏  |  浏览/下载:35/12  |  提交时间:2024/07/08
基于多模态协同的驾驶行为预测 学位论文
, 2024
作者:  董清辉
Adobe PDF(5017Kb)  |  收藏  |  浏览/下载:38/1  |  提交时间:2024/07/08
人车共驾,驾驶行为预测,多模态协同,轨迹预测,多任务学习  
UNSUPERVISED LEARNING OF NEURAL SEMANTIC MAPPINGS WITH THE HUNGARIAN ALGORITHM FOR COMPOSITIONAL SEMANTICS 会议论文
, Seoul, South Korea, 2024-04
作者:  Zhang X(张翔);  He SZ(何世柱);  Liu K(刘康);  Zhao J(赵军)
Adobe PDF(294Kb)  |  收藏  |  浏览/下载:57/26  |  提交时间:2024/06/27
Born a BabyNet with Hierarchical Parental Supervision for End-to-End Text Image Machine Translation 会议论文
Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Torino, Italia, 20-25 May, 2024
作者:  Ma, Cong;  Zhang, Yaping;  Zhang, Zhiyang;  Liang, Yupu;  Zhao, Yang;  Zhou, Yu;  Zong, Chengqing
Adobe PDF(891Kb)  |  收藏  |  浏览/下载:36/15  |  提交时间:2024/06/27