CASIA OpenIR

Browse/Search Results:  1-10 of 35 Help

Selected(0)Clear Items/Page:    Sort:
Global-Attention-Based Neural Networks for Vision Language Intelligence 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2021, 卷号: 8, 期号: 7, 页码: 1243-1252
Authors:  Pei Liu;  Yingjie Zhou;  Dezhong Peng;  Dapeng Wu
Adobe PDF(24864Kb)  |  Favorite  |  View/Download:1/0  |  Submit date:2021/06/11
Global attention  image captioning  latent contribution  
基于生成模型的人脸妆容分析 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  李祎
Adobe PDF(14427Kb)  |  Favorite  |  View/Download:131/8  |  Submit date:2020/06/10
人脸图像合成  妆容分析  对抗学习  语义指导  解耦表示  
面向行人重识别的多视角机器学习模型与算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
Authors:  张志忠
Adobe PDF(7131Kb)  |  Favorite  |  View/Download:102/12  |  Submit date:2020/06/10
行人重识别  多视角机器学习  特征融合  度量学习  深度卷积神经网络  
Improving Description-Based Person Re-Identification by Multi-Granularity Image-Text Alignments 期刊论文
IEEE Transactions on Image Processing, 2020, 卷号: 29, 期号: 1, 页码: 15
Authors:  Niu, Kai;  Huang, Yan;  Ouyang, Wanli;  Wang, Liang
View  |  Adobe PDF(5193Kb)  |  Favorite  |  View/Download:23/3  |  Submit date:2020/10/09
Description-based person re-identification  Multi-granularity image-text alignments  Step training strategy  
基于注意与记忆机制的视觉描述 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
Authors:  王君波
Adobe PDF(6335Kb)  |  Favorite  |  View/Download:207/1  |  Submit date:2020/01/07
视觉描述  注意与记忆机制  长序列建模  模态相关性  关系学习  
Pyrboxes: An efficient multi-scale scene text detector with feature pyramids 期刊论文
PATTERN RECOGNITION LETTERS, 2019, 卷号: 125, 期号: 2019, 页码: 228-234
Authors:  Sheng, Fenfen;  Chen, Zhineng;  Zhang, Wei;  Xu, Bo
View  |  Adobe PDF(1558Kb)  |  Favorite  |  View/Download:78/4  |  Submit date:2019/12/16
Scene text detection  Multi-scale text detection  Grouped pyramid module  Efficient and effective  
面向用户行为序列的深度上下文建模 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  崔强
Adobe PDF(12117Kb)  |  Favorite  |  View/Download:151/12  |  Submit date:2019/06/18
上下文信息  深度学习  用户行为序列  循环神经网络  注意力机制  
Read, Watch, Listen, and Summarize: Multi-Modal Summarization for Asynchronous Text, Image, Audio and Video 期刊论文
IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2019, 卷号: 31, 期号: 5, 页码: 996-1009
Authors:  Li, Haoran;  Zhu, Junnan;  Ma, Cong;  Zhang, Jiajun;  Zong, Chengqing
View  |  Adobe PDF(2826Kb)  |  Favorite  |  View/Download:137/30  |  Submit date:2019/07/12
Summarization  multimedia  multi-modal  cross-modal  natural language processing  computer vision  
Name-face association with web facial image supervision 期刊论文
MULTIMEDIA SYSTEMS, 2019, 卷号: 25, 期号: 1, 页码: 1-20
Authors:  Chen, Zhineng;  Zhang, Wei;  Deng, Bin;  Xie, Hongtao;  Gu, Xiaoyan
View  |  Adobe PDF(3705Kb)  |  Favorite  |  View/Download:70/0  |  Submit date:2019/07/12
Name-face association  Image matching  Multimedia fusion  Web facial images  Weakly supervised  
Inductive Zero-Shot Image Annotation via Embedding Graph 期刊论文
IEEE ACCESS, 2019, 卷号: 7, 页码: 107816-107830
Authors:  Wang, Fangxin;  Liu, Jie;  Zhang, Shuwu;  Zhang, Guixuan;  Li, Yuejun;  Yuan, Fei
View  |  Adobe PDF(1472Kb)  |  Favorite  |  View/Download:107/20  |  Submit date:2019/10/08
Contextualized word embeddings  graph convolutional network  image annotation  Node2Vec  zero-shot