CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
Attention Analysis and Calibration for Transformer in Natural Language Generation 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2022, 页码: 1927-1938
作者:  Yu, Lu;  Jiajun, Zhang;  Jiali, Zeng;  Shuangzhi, Wu;  Chengqing, Zong
Adobe PDF(1978Kb)  |  收藏  |  浏览/下载:128/36  |  提交时间:2023/05/31
神经机器翻译  
Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文
ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23
作者:  Song, Yaguang;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:140/41  |  提交时间:2023/04/25
Cross modal  video retrieval  deep learning  graph neural networks  
Many Hands Make Light Work: Transferring Knowledge from Auxiliary Tasks for Video-Text Retrieval 期刊论文
IEEE Transactions on Multimedia, 2022, 页码: 1-15
作者:  Wang, Wei;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(3679Kb)  |  收藏  |  浏览/下载:109/20  |  提交时间:2023/04/25
Weakly-Supervised Video Object Grounding Via Learning Uni-Modal Associations 期刊论文
IEEE Transactions on Multimedia, 2022, 卷号: 25, 页码: 1-12
作者:  Wang, Wei;  Gao, Junyu;  Xu, Changsheng
Adobe PDF(5406Kb)  |  收藏  |  浏览/下载:99/29  |  提交时间:2023/04/25
Visualization  Grounding  Task analysis  Prototypes  Annotations  Uncertainty  Proposals  Cross-modal retrieval  weakly-supervised learning  video object grounding  uni-modal association  
ArtCap: A Dataset for Image Captioning of Fine Art Paintings 期刊论文
IEEE TRANSACTIONS ON COMPUTATIONAL SOCIAL SYSTEMS, 2022, 页码: 12
作者:  Lu, Yue;  Guo, Chao;  Dai, Xingyuan;  Wang, Fei-Yue
Adobe PDF(5137Kb)  |  收藏  |  浏览/下载:244/44  |  提交时间:2023/02/22
Dataset construction  image captioning  painting captioning  
An Orthogonal Subspace Decomposition Method for Cross-Modal Retrieval 期刊论文
IEEE INTELLIGENT SYSTEMS, 2022, 卷号: 37, 期号: 3, 页码: 45-53
作者:  Zeng, Zhixiong;  Xu, Nan;  Mao, Wenji;  Zeng, Daniel
Adobe PDF(2545Kb)  |  收藏  |  浏览/下载:258/39  |  提交时间:2022/09/19
Semantics  Representation learning  Task analysis  Matrix decomposition  Automation  Interference  Intelligent systems  Cross-modal Retrieval  Representation Learning  Orthogonal Decomposition  
领域跨媒体知识表达与推理技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张莹莹
Adobe PDF(13493Kb)  |  收藏  |  浏览/下载:422/16  |  提交时间:2022/06/22
知识图谱  表示学习  多模态  推理  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1128/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
Data-efficient image captioning of fine art paintings via virtual-real semantic alignment training 期刊论文
Neurocomputing, 2022, 页码: 163–180
作者:  Lu Yue;  Guo Chao;  Dai Xingyuan;  Wang Fei-yue
Adobe PDF(6207Kb)  |  收藏  |  浏览/下载:233/68  |  提交时间:2022/06/16
平行艺术  绘画图像标注  
面向开放环境模式识别的小样本学习方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  王瑞琪
Adobe PDF(6050Kb)  |  收藏  |  浏览/下载:331/22  |  提交时间:2022/06/15
小样本学习  广义小样本学习  特征自适应  数据增强  表示学习