CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共8条,第1-8条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
HAIR: Hierarchical Visual-Semantic Relational Reasoning for Video Question Answering 会议论文
, 线上, 2021-10
作者:  Liu, Fei;  Liu, Jing;  Wang, Weining;  Lu, Hanqing
Adobe PDF(1174Kb)  |  收藏  |  浏览/下载:213/48  |  提交时间:2022/06/15
Erasing-based Attention Learning for Visual Question Answering 会议论文
, Nice, France, 2019-10
作者:  Liu, Fei;  Liu, Jing;  Hong, Richang;  Lu, Hanqing
Adobe PDF(2319Kb)  |  收藏  |  浏览/下载:188/57  |  提交时间:2022/06/15
Language and Visual Relations Encoding for Visual Question Answering 会议论文
, 中国台湾, 2019-9
作者:  Liu, Fei;  Liu, Jing;  Fang, Zhiwei;  Lu, Hanqing
Adobe PDF(694Kb)  |  收藏  |  浏览/下载:166/62  |  提交时间:2022/06/15
Dual Hierarchical Temporal Convolutional Network with QA-Aware Dynamic Normalization for Video Story Question Answering 会议论文
, 线上, 2020-10
作者:  Liu, Fei;  Liu, Jing;  Zhu, Xinxin;  Hong, Richang;  Lu, Hanqing
Adobe PDF(2797Kb)  |  收藏  |  浏览/下载:359/181  |  提交时间:2022/06/15
Densely Connected Attention Flow for Visual Question Answering 会议论文
, 中国澳门, 2019-8
作者:  Liu, Fei;  Liu, Jing;  Fang, Zhiwei;  Hong, Richang
Adobe PDF(681Kb)  |  收藏  |  浏览/下载:165/67  |  提交时间:2022/06/14
基于多模态交互与注意力机制的视觉问答 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  刘飞
Adobe PDF(10058Kb)  |  收藏  |  浏览/下载:444/17  |  提交时间:2022/06/13
视觉问答  多模态交互  注意力机制  关系推理  
Question-Guided Erasing-Based Spatiotemporal Attention Learning for Video Question Answering 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 0
作者:  Liu, Fei;  Liu, Jing;  Hong, Richang;  Lu, Hanqing
Adobe PDF(3550Kb)  |  收藏  |  浏览/下载:361/91  |  提交时间:2022/01/27
video question answering  attention mechanism  metric learning  
Visual Question Answering With Dense Inter- and Intra-Modality Interactions 期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2021, 卷号: 23, 页码: 3518-3529
作者:  Liu, Fei;  Liu, Jing;  Fang, Zhiwei;  Hong, Richang;  Lu, Hanqing
Adobe PDF(2891Kb)  |  收藏  |  浏览/下载:332/73  |  提交时间:2021/12/28
Visualization  Knowledge discovery  Connectors  Encoding  Task analysis  Image coding  Stacking  Visual question answering  attention  dense interactions