CASIA OpenIR

浏览/检索结果: 共9条,第1-9条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
Cross-Modal Prototype Learning for Zero-Shot Handwritten Character Recognition 期刊论文
Pattern Recognition, 2022, 卷号: 131, 页码: 108859
作者:  Ao, Xiang;  Zhang, Xu-Yao;  Liu, Cheng-Lin
Adobe PDF(3111Kb)  |  收藏  |  浏览/下载:58/25  |  提交时间:2024/05/30
Attention Analysis and Calibration for Transformer in Natural Language Generation 期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2022, 页码: 1927-1938
作者:  Yu, Lu;  Jiajun, Zhang;  Jiali, Zeng;  Shuangzhi, Wu;  Chengqing, Zong
Adobe PDF(1978Kb)  |  收藏  |  浏览/下载:168/48  |  提交时间:2023/05/31
神经机器翻译  
Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文
ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23
作者:  Song, Yaguang;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:183/57  |  提交时间:2023/04/25
Cross modal  video retrieval  deep learning  graph neural networks  
Weakly-Supervised Video Object Grounding Via Learning Uni-Modal Associations 期刊论文
IEEE Transactions on Multimedia, 2022, 卷号: 25, 页码: 1-12
作者:  Wang, Wei;  Gao, Junyu;  Xu, Changsheng
Adobe PDF(5406Kb)  |  收藏  |  浏览/下载:140/41  |  提交时间:2023/04/25
Visualization  Grounding  Task analysis  Prototypes  Annotations  Uncertainty  Proposals  Cross-modal retrieval  weakly-supervised learning  video object grounding  uni-modal association  
ArtCap: A Dataset for Image Captioning of Fine Art Paintings 期刊论文
IEEE TRANSACTIONS ON COMPUTATIONAL SOCIAL SYSTEMS, 2022, 页码: 12
作者:  Lu, Yue;  Guo, Chao;  Dai, Xingyuan;  Wang, Fei-Yue
Adobe PDF(5137Kb)  |  收藏  |  浏览/下载:287/54  |  提交时间:2023/02/22
Dataset construction  image captioning  painting captioning  
领域跨媒体知识表达与推理技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张莹莹
Adobe PDF(13493Kb)  |  收藏  |  浏览/下载:480/18  |  提交时间:2022/06/22
知识图谱  表示学习  多模态  推理  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1170/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
Data-efficient image captioning of fine art paintings via virtual-real semantic alignment training 期刊论文
Neurocomputing, 2022, 页码: 163–180
作者:  Lu Yue;  Guo Chao;  Dai Xingyuan;  Wang Fei-yue
Adobe PDF(6207Kb)  |  收藏  |  浏览/下载:261/75  |  提交时间:2022/06/16
平行艺术  绘画图像标注  
面向开放环境模式识别的小样本学习方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  王瑞琪
Adobe PDF(6050Kb)  |  收藏  |  浏览/下载:358/23  |  提交时间:2022/06/15
小样本学习  广义小样本学习  特征自适应  数据增强  表示学习