已选(0)清除
条数/页: 排序方式: |
| Paradigm Shift in Natural Language Processing 期刊论文 Machine Intelligence Research, 2022, 卷号: 19, 期号: 3, 页码: 169-183 作者: Tian-Xiang Sun; Xiang-Yang Liu; Xi-Peng Qiu; Xuan-Jing Huang Adobe PDF(1449Kb)  |  收藏  |  浏览/下载:9/3  |  提交时间:2024/04/23 Face detection global context attention mechanism computer vision deep learning |
| Second-Order Global Attention Networks for Graph Classification and Regression 会议论文 , Beijing, China, August 27-28, 2022 作者: Hu Fenyu; Cui Zeyu; Wu Shu; Liu Qiang; Wu Jinlin; Wang Liang; Tan Tieniu Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:176/67  |  提交时间:2023/07/06 |
| 基于关系学习与知识迁移的多媒体内容理解与应用 学位论文 , 2023 作者: 宋亚光 Adobe PDF(11550Kb)  |  收藏  |  浏览/下载:103/5  |  提交时间:2023/06/09 多媒体内容理解 多模态 关系学习 知识迁移 个性化 |
| Learning Video-Text Aligned Representations for Video Captioning 期刊论文 ACM Trans. Multimedia Comput. Commun. Appl., 2023, 页码: 1-21 作者: Yaya Shi; Haiyang Xu; Chunfeng Yuan; Bing Li; Weiming Hu,; Zhengjun Zha Adobe PDF(3574Kb)  |  收藏  |  浏览/下载:184/68  |  提交时间:2023/04/28 |
| Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文 ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23 作者: Song, Yaguang; Gao, Junyu; Yang, Xiaoshan; Xu, Changsheng Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:134/41  |  提交时间:2023/04/25 Cross modal video retrieval deep learning graph neural networks |
| Visuals to Text: A Comprehensive Review on Automatic Image Captioning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 8, 页码: 1339-1365 作者: Yue Ming; Nannan Hu; Chunxiao Fan; Fan Feng; Jiangwan Zhou; Hui Yu Adobe PDF(56128Kb)  |  收藏  |  浏览/下载:150/21  |  提交时间:2022/08/01 Artificial intelligence attention mechanism encoder-decoder framework image captioning multi-modal understanding training strategies |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| A Multi-Task MRC Framework for Chinese Emotion Cause and Experiencer Extraction 会议论文 , Bratislava, Slovakia, 2021-09 作者: Haoda Qian; Qiudan Li; Zaichuan Tang Adobe PDF(79001Kb)  |  收藏  |  浏览/下载:319/121  |  提交时间:2022/06/14 |
| 面向自然人机交互的语言-视觉物体定位方法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李钱钟 Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:269/13  |  提交时间:2022/06/13 自然人机交互 零样本物体检测 自然语言-图像指代表达理解 自然语言-视频指代表达理解 |
| Scribble-Supervised Video Object Segmentation 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 2, 页码: 339-353 作者: Peiliang Huang; Junwei Han; Nian Liu; Jun Ren; Dingwen Zhang Adobe PDF(15349Kb)  |  收藏  |  浏览/下载:156/23  |  提交时间:2021/11/03 Convolutional neural networks (CNNs) scribble self-attention video object segmentation weakly supervised |