已选(0)清除
条数/页: 排序方式: |
| Causal Reasoning Meets Visual Representation Learning: A Prospective Study 期刊论文 Machine Intelligence Research, 2022, 卷号: 19, 期号: 6, 页码: 485-511 作者: Yang Liu; Yu-Shen Wei; Hong Yan; Guan-Bin Li; Liang Lin Adobe PDF(3224Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/04/23 Causal reasoning visual representation learning reliable artificial intelligence spatial-temporal data multi-modal analysis |
| Second-Order Global Attention Networks for Graph Classification and Regression 会议论文 , Beijing, China, August 27-28, 2022 作者: Hu Fenyu; Cui Zeyu; Wu Shu; Liu Qiang; Wu Jinlin; Wang Liang; Tan Tieniu Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:174/67  |  提交时间:2023/07/06 |
| 跨模态数据引导的视觉场景分割 学位论文 , 2023 作者: 甘睿彤 Adobe PDF(4856Kb)  |  收藏  |  浏览/下载:123/6  |  提交时间:2023/05/29 视觉场景分割 跨模态数据引导 跨模态特征融合 语义分割 |
| A Large-Scale Chinese Multimodal NER Dataset with Speech Clues 会议论文 , Online, 2021-8 作者: Sui DB(隋典伯); Zhengkun Tian; Yubo Chen; Kang Liu; Jun Zhao Adobe PDF(749Kb)  |  收藏  |  浏览/下载:181/53  |  提交时间:2022/06/28 |
| 基于多模态交互与注意力机制的视觉问答 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 刘飞 Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:379/17  |  提交时间:2022/06/13 视觉问答 多模态交互 注意力机制 关系推理 |
| 基于语义的跨模态检索研究 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 程文龙 Adobe PDF(3471Kb)  |  收藏  |  浏览/下载:290/16  |  提交时间:2022/06/13 跨模态检索 视觉问答 语音-图像检索 三模态排序损失 循环一致性损失 |
| Learning Coarse-to-Fine Graph Neural Networks for Video-Text Retrieval 期刊论文 IEEE TRANSACTIONS ON MULTIMEDIA, 2021, 卷号: 23, 页码: 2386-2397 作者: Wang, Wei; Gao, Junyu; Yang, Xiaoshan; Xu, Changsheng Adobe PDF(2165Kb)  |  收藏  |  浏览/下载:306/42  |  提交时间:2021/11/02 Feature extraction Encoding Task analysis Semantics Data models Cognition Focusing Video-text retrieval graph neural network coarse-to-fine strategy |
| 基于序列生成的图像语义描述 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 郭龙腾 Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:305/20  |  提交时间:2021/06/24 图像语义描述 视觉和语言 序列生成 注意力机制 非自回归解码 |
| MFSR: Maximum Feature Score Region-based Captions Locating in News Video Images 期刊论文 International Journal of Automation and Computing, 2018, 卷号: 15, 期号: 4, 页码: 454-461 作者: Zhi-Heng Wang; Chao Guo; Hong-Min Liu; Zhan-Qiang Huo 浏览  |  Adobe PDF(2780Kb)  |  收藏  |  浏览/下载:95/26  |  提交时间:2021/02/23 News video images captions recognizing captions locating content understanding maximum feature score region (MFSR). |
| A Co-Memory Network for Multimodal Sentiment Analysis 会议论文 , Ann Arbor, MI, USA, July 8-12, 2018 作者: Xu, Nan; Mao, Wenji; Chen, Guandan 浏览  |  Adobe PDF(1334Kb)  |  收藏  |  浏览/下载:255/111  |  提交时间:2020/06/10 |