CASIA OpenIR

浏览/检索结果: 共26条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
Paradigm Shift in Natural Language Processing 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 3, 页码: 169-183
作者:  Tian-Xiang Sun;  Xiang-Yang Liu;  Xi-Peng Qiu;  Xuan-Jing Huang
Adobe PDF(1449Kb)  |  收藏  |  浏览/下载:9/3  |  提交时间:2024/04/23
Face detection  global context  attention mechanism  computer vision  deep learning  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:176/67  |  提交时间:2023/07/06
基于关系学习与知识迁移的多媒体内容理解与应用 学位论文
, 2023
作者:  宋亚光
Adobe PDF(11550Kb)  |  收藏  |  浏览/下载:103/5  |  提交时间:2023/06/09
多媒体内容理解  多模态  关系学习  知识迁移  个性化  
Learning Video-Text Aligned Representations for Video Captioning 期刊论文
ACM Trans. Multimedia Comput. Commun. Appl., 2023, 页码: 1-21
作者:  Yaya Shi;  Haiyang Xu;  Chunfeng Yuan;  Bing Li;  Weiming Hu,;  Zhengjun Zha
Adobe PDF(3574Kb)  |  收藏  |  浏览/下载:184/68  |  提交时间:2023/04/28
Learning Hierarchical Video Graph Networks for One-Stop Video Delivery 期刊论文
ACM Transactions on Multimedia Computing, Communications, and Applications, 2022, 卷号: 18, 期号: 1, 页码: 1-23
作者:  Song, Yaguang;  Gao, Junyu;  Yang, Xiaoshan;  Xu, Changsheng
Adobe PDF(7608Kb)  |  收藏  |  浏览/下载:134/41  |  提交时间:2023/04/25
Cross modal  video retrieval  deep learning  graph neural networks  
Visuals to Text: A Comprehensive Review on Automatic Image Captioning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 8, 页码: 1339-1365
作者:  Yue Ming;  Nannan Hu;  Chunxiao Fan;  Fan Feng;  Jiangwan Zhou;  Hui Yu
Adobe PDF(56128Kb)  |  收藏  |  浏览/下载:150/21  |  提交时间:2022/08/01
Artificial intelligence  attention mechanism  encoder-decoder framework  image captioning  multi-modal understanding  training strategies  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
A Multi-Task MRC Framework for Chinese Emotion Cause and Experiencer Extraction 会议论文
, Bratislava, Slovakia, 2021-09
作者:  Haoda Qian;  Qiudan Li;  Zaichuan Tang
Adobe PDF(79001Kb)  |  收藏  |  浏览/下载:319/121  |  提交时间:2022/06/14
面向自然人机交互的语言-视觉物体定位方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李钱钟
Adobe PDF(42933Kb)  |  收藏  |  浏览/下载:269/13  |  提交时间:2022/06/13
自然人机交互  零样本物体检测  自然语言-图像指代表达理解  自然语言-视频指代表达理解  
Scribble-Supervised Video Object Segmentation 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 2, 页码: 339-353
作者:  Peiliang Huang;  Junwei Han;  Nian Liu;  Jun Ren;  Dingwen Zhang
Adobe PDF(15349Kb)  |  收藏  |  浏览/下载:156/23  |  提交时间:2021/11/03
Convolutional neural networks (CNNs)  scribble  self-attention  video object segmentation  weakly supervised