CASIA OpenIR

浏览/检索结果: 共40条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
HiCMAE: Hierarchical Contrastive Masked Autoencoder for self-supervised Audio-Visual Emotion Recognition 期刊论文
Information Fusion, 2024, 页码: 1-20
作者:  Licai Sun;  Zheng Lian;  Bin Liu;  Jianhua Tao
Adobe PDF(2281Kb)  |  收藏  |  浏览/下载:38/9  |  提交时间:2024/05/31
CGFormer: ViT-Based Network for Identifying Computer-Generated Images With Token Labeling 期刊论文
IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, 2024, 卷号: 19, 页码: 235-250
作者:  Quan, Weize;  Deng, Pengfei;  Wang, Kai;  Yan, Dong-Ming
Adobe PDF(2517Kb)  |  收藏  |  浏览/下载:69/1  |  提交时间:2024/02/22
CG image forensics  transformer  token labeling  generalization  robustness  
Toward Accurate and Efficient Road Extraction by Leveraging the Characteristics of Road Shapes 期刊论文
IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING, 2023, 卷号: 61, 页码: 16
作者:  Wang, Changwei;  Xu, Rongtao;  Xu, Shibiao;  Meng, Weiliang;  Wang, Ruisheng;  Zhang, Jiguang;  Zhang, Xiaopeng
Adobe PDF(13777Kb)  |  收藏  |  浏览/下载:137/9  |  提交时间:2023/11/17
Efficient and accurate road extraction  efficient strip transformer module (ESTM)  geometric deformation estimation module (GDEM)  road edge focal loss (REF loss)  road shape-aware network (RSANet)  
Prototypical context-aware dynamics generalization for high-dimensional model-based reinforcement learning 会议论文
, Kigali City, Rwanda, Africa, 2023-5-5
作者:  Junjie, Wang;  Yao, Mu;  Dong, Li;  Qichao,Zhang;  Dongbin, Zhao;  Yuzheng, Zhuang;  Ping, Luo;  Bin, Wang;  Jianye, Hao
Adobe PDF(3492Kb)  |  收藏  |  浏览/下载:154/41  |  提交时间:2023/06/29
基于域迁移的立体匹配方法研究 学位论文
, 2023
作者:  张承灏
Adobe PDF(18423Kb)  |  收藏  |  浏览/下载:191/10  |  提交时间:2023/06/29
立体匹配  域迁移  多任务学习  多模态学习  连续学习  
视频中的文本检测与跟踪方法研究 学位论文
, 2023
作者:  张峻博
Adobe PDF(24487Kb)  |  收藏  |  浏览/下载:201/4  |  提交时间:2023/06/25
视频文本检测  文本跟踪  BiRViT-1K  鲁棒特征表示  Transformer  
Recovering Generalization via Pre-training-like Knowledge Distillation for Out-of-Distribution Visual Question Answering 期刊论文
IEEE Transactions on Multimedia, 2023, 页码: 1-15
作者:  Song, Yaguang;  Yang, Xiaoshan;  Wang, Yaowei;  Xu, Changsheng
Adobe PDF(2397Kb)  |  收藏  |  浏览/下载:191/48  |  提交时间:2023/06/12
Multi-modal Foundation Model  Out-of-Distribution Generalization  Visual Question Answering  Knowledge Distillation  
面向行人重识别的表征学习 学位论文
工学博士, 自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴锦林
Adobe PDF(6908Kb)  |  收藏  |  浏览/下载:337/15  |  提交时间:2022/07/05
行人重识别  视角无偏  时序移动注意力  领域适应  无监督  
基于增强文本表示的新闻推荐方法及其面向特定领域的应用研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  孙颖
Adobe PDF(1995Kb)  |  收藏  |  浏览/下载:249/8  |  提交时间:2022/06/15
新闻推荐  增强文本表示  类别层次结构  候选新闻交互  面向领域的推荐  
A Multi-Task MRC Framework for Chinese Emotion Cause and Experiencer Extraction 会议论文
, Bratislava, Slovakia, 2021-09
作者:  Haoda Qian;  Qiudan Li;  Zaichuan Tang
Adobe PDF(79001Kb)  |  收藏  |  浏览/下载:352/124  |  提交时间:2022/06/14