已选(0)清除
条数/页: 排序方式: |
| 基于关系学习与知识迁移的多媒体内容理解与应用 学位论文 , 2023 作者: 宋亚光 Adobe PDF(11550Kb)  |  收藏  |  浏览/下载:90/4  |  提交时间:2023/06/09 多媒体内容理解 多模态 关系学习 知识迁移 个性化 |
| Learning Video-Text Aligned Representations for Video Captioning 期刊论文 ACM Trans. Multimedia Comput. Commun. Appl., 2023, 页码: 1-21 作者: Yaya Shi; Haiyang Xu; Chunfeng Yuan; Bing Li; Weiming Hu,; Zhengjun Zha Adobe PDF(3574Kb)  |  收藏  |  浏览/下载:128/47  |  提交时间:2023/04/28 |
| Second-Order Global Attention Networks for Graph Classification and Regression 会议论文 , Beijing, China, August 27-28, 2022 作者: Hu Fenyu; Cui Zeyu; Wu Shu; Liu Qiang; Wu Jinlin; Wang Liang; Tan Tieniu Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:149/64  |  提交时间:2023/07/06 |
| 面向自然人机交互的语言-视觉物体定位方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李钱钟 Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:253/13  |  提交时间:2022/06/13 自然人机交互 零样本物体检测 自然语言-图像指代表达理解 自然语言-视频指代表达理解 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1094/13  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文 ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23 作者: Song, Yaguang; Gao, Junyu; Yang, Xiaoshan; Xu, Changsheng Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:99/30  |  提交时间:2023/04/25 Cross modal video retrieval deep learning graph neural networks |
| Visuals to Text: A Comprehensive Review on Automatic Image Captioning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 8, 页码: 1339-1365 作者: Yue Ming; Nannan Hu; Chunxiao Fan; Fan Feng; Jiangwan Zhou; Hui Yu Adobe PDF(56128Kb)  |  收藏  |  浏览/下载:131/19  |  提交时间:2022/08/01 Artificial intelligence attention mechanism encoder-decoder framework image captioning multi-modal understanding training strategies |
| Scribble-Supervised Video Object Segmentation 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 2, 页码: 339-353 作者: Peiliang Huang; Junwei Han; Nian Liu; Jun Ren; Dingwen Zhang Adobe PDF(15349Kb)  |  收藏  |  浏览/下载:144/21  |  提交时间:2021/11/03 Convolutional neural networks (CNNs) scribble self-attention video object segmentation weakly supervised |
| A Multi-Task MRC Framework for Chinese Emotion Cause and Experiencer Extraction 会议论文 , Bratislava, Slovakia, 2021-09 作者: Haoda Qian; Qiudan Li; Zaichuan Tang Adobe PDF(79001Kb)  |  收藏  |  浏览/下载:290/118  |  提交时间:2022/06/14 |
| 基于序列生成的图像语义描述 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021 作者: 郭龙腾 Adobe PDF(6291Kb)  |  收藏  |  浏览/下载:285/20  |  提交时间:2021/06/24 图像语义描述 视觉和语言 序列生成 注意力机制 非自回归解码 |