CASIA OpenIR

浏览/检索结果: 共19条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Causal Reasoning Meets Visual Representation Learning: A Prospective Study 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 6, 页码: 485-511
作者:  Yang Liu;  Yu-Shen Wei;  Hong Yan;  Guan-Bin Li;  Liang Lin
Adobe PDF(3224Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/04/23
Causal reasoning  visual representation learning  reliable artificial intelligence  spatial-temporal data  multi-modal analysis  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:174/67  |  提交时间:2023/07/06
跨模态数据引导的视觉场景分割 学位论文
, 2023
作者:  甘睿彤
Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:123/6  |  提交时间:2023/05/29
视觉场景分割  跨模态数据引导  跨模态特征融合  语义分割  
A Large-Scale Chinese Multimodal NER Dataset with Speech Clues 会议论文
, Online, 2021-8
作者:  Sui DB(隋典伯);  Zhengkun Tian;  Yubo Chen;  Kang Liu;  Jun Zhao
Adobe PDF(749Kb)  |  收藏  |  浏览/下载:181/53  |  提交时间:2022/06/28
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  刘飞
Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:379/17  |  提交时间:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
基于语义的跨模态检索研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  程文龙
Adobe PDF(3471Kb)  |  收藏  |  浏览/下载:290/16  |  提交时间:2022/06/13
跨模态检索  视觉问答  语音-图像检索  三模态排序损失  循环一致性损失  
Learning Coarse-to-Fine Graph Neural Networks for Video-Text Retrieval 期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2021, 卷号: 23, 页码: 2386-2397
作者:  Wang, Wei;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(2165Kb)  |  收藏  |  浏览/下载:306/42  |  提交时间:2021/11/02
Feature extraction  Encoding  Task analysis  Semantics  Data models  Cognition  Focusing  Video-text retrieval  graph neural network  coarse-to-fine strategy  
基于序列生成的图像语义描述 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  郭龙腾
Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:305/20  |  提交时间:2021/06/24
图像语义描述  视觉和语言  序列生成  注意力机制  非自回归解码  
MFSR: Maximum Feature Score Region-based Captions Locating in News Video Images 期刊论文
International Journal of Automation and Computing, 2018, 卷号: 15, 期号: 4, 页码: 454-461
作者:  Zhi-Heng Wang;  Chao Guo;  Hong-Min Liu;  Zhan-Qiang Huo
浏览  |  Adobe PDF(2780Kb)  |  收藏  |  浏览/下载:95/26  |  提交时间:2021/02/23
News video images  captions recognizing  captions locating  content understanding  maximum feature score region (MFSR).  
A Co-Memory Network for Multimodal Sentiment Analysis 会议论文
, Ann Arbor, MI, USA, July 8-12, 2018
作者:  Xu, Nan;  Mao, Wenji;  Chen, Guandan
浏览  |  Adobe PDF(1334Kb)  |  收藏  |  浏览/下载:255/111  |  提交时间:2020/06/10