CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
DMRM: A Dual-Channel Multi-Hop Reasoning Model for Visual Dialog 会议论文
, 美国纽约, 2020.2
作者:  Feilong Chen;  Fandong Meng;  Jiaming Xu;  Peng Li;  Bo Xu;  Jie Zhou
Adobe PDF(3052Kb)  |  收藏  |  浏览/下载:113/26  |  提交时间:2023/06/07
Object Relational Graph with Teacher-Recommended Learning for Video Captioning 会议论文
2020, 线上, 2020.6.14-19
作者:  Zhang,Ziqi;  Shi,Yaya;  Yuan,Chunfeng;  Li,Bing;  Wang,Peijin;  Hu,Weiming;  Zha,Zhengjun
Adobe PDF(1547Kb)  |  收藏  |  浏览/下载:191/69  |  提交时间:2022/06/16
Dual Hierarchical Temporal Convolutional Network with QA-Aware Dynamic Normalization for Video Story Question Answering 会议论文
, 线上, 2020-10
作者:  Liu, Fei;  Liu, Jing;  Zhu, Xinxin;  Hong, Richang;  Lu, Hanqing
Adobe PDF(2797Kb)  |  收藏  |  浏览/下载:333/175  |  提交时间:2022/06/15
Show, Tell, and Polish: Ruminant Decoding for Image Captioning 期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2020, 卷号: 22, 期号: 8, 页码: 2149-2162
作者:  Guo, Longteng;  Liu, Jing;  Lu, Shichen;  Lu, Hanqing
Adobe PDF(4378Kb)  |  收藏  |  浏览/下载:208/32  |  提交时间:2020/08/31
Image captioning  Multi-pass decoding  Rumination  
面向行人重识别的多视角机器学习模型与算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  张志忠
Adobe PDF(7131Kb)  |  收藏  |  浏览/下载:316/19  |  提交时间:2020/06/10
行人重识别  多视角机器学习  特征融合  度量学习  深度卷积神经网络  
Long video question answering: A Matching-guided Attention Model 期刊论文
PATTERN RECOGNITION, 2020, 卷号: 102, 期号: 1, 页码: 11
作者:  Wang, Weining;  Huang, Yan;  Wang, Liang
浏览  |  Adobe PDF(1963Kb)  |  收藏  |  浏览/下载:362/70  |  提交时间:2020/06/02
Long video QA  Matching-guided attention