CASIA OpenIR

Browse/Search Results:  1-10 of 61 Help

Selected(0)Clear Items/Page:    Sort:
Reading selectively via Binary Input Gated Recurrent Unit 会议论文
, 中国澳门, 2019-08
Authors:  Li Z(李哲);  Wang PS(王培松);  Lu HQ(卢汉清);  Cheng J(程健)
View  |  Adobe PDF(1207Kb)  |  Favorite  |  View/Download:85/36  |  Submit date:2019/05/10
Improving visual question answering using dropout and enhanced question encoder 期刊论文
PATTERN RECOGNITION, 2019, 卷号: 90, 期号: 1, 页码: 404-414
Authors:  Fang, Zhiwei;  Liu, Jing;  Li, Yong;  Qiao, Yanyuan;  Lu, Hanqing
View  |  Adobe PDF(1624Kb)  |  Favorite  |  View/Download:62/15  |  Submit date:2019/04/23
Visual question answering  Coherent dropout  Siamese dropout  Enhanced question encoder  
Dense semantic embedding network for image captioning 期刊论文
PATTERN RECOGNITION, 2019, 卷号: 90, 页码: 285-296
Authors:  Xiao, Xinyu;  Wang, Lingfeng;  Ding, Kun;  Xiang, Shiming;  Pan, Chunhong
Favorite  |  View/Download:30/0  |  Submit date:2019/04/23
Image captioning  Retrieval  High-level semantic information  Visual concept  Densely embedding  Long short-term memory  
引入物理环境信息的问答技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2019
Authors:  姚轶群
Adobe PDF(2023Kb)  |  Favorite  |  View/Download:64/5  |  Submit date:2019/06/17
自然语言理解  物理环境  视觉  问答  推理  
Inductive Zero-Shot Image Annotation via Embedding Graph 期刊论文
IEEE Access, 2019, 卷号: 7, 期号: 0, 页码: 107816-107830
Authors:  Wang Fangxin(王方心);  Liu Jie;  Zhang Shuwu;  Zhang Guixuan;  Li Yuejun;  Yuan Fei
View  |  Adobe PDF(1472Kb)  |  Favorite  |  View/Download:31/10  |  Submit date:2019/10/08
Contextualized Word Embeddings  Graph Convolutional Network  Image Annotation  Node2vec  Zero-shot  
基于深度学习的视听多模态融合及生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
Authors:  郝王丽
Adobe PDF(10215Kb)  |  Favorite  |  View/Download:68/4  |  Submit date:2019/06/18
多模态感知,模态补足,视听融合,视听生成  
任务型对话系统中口语理解模块方法研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2019
Authors:  白赫
Adobe PDF(2958Kb)  |  Favorite  |  View/Download:40/4  |  Submit date:2019/06/17
对话系统  口语理解  跨语言迁移  强化学习  多任务学习  
Answer Distillation for Visual Question Answering 会议论文
, Perth, Australia, 2018.12
Authors:  Fang, Zhiwei;  Liu, Jing;  Tang, Qu;  Li, Yong;  Lu, Hanqing
View  |  Adobe PDF(2077Kb)  |  Favorite  |  View/Download:58/25  |  Submit date:2019/05/05
基于视频摘要的机器⼈学习⽅法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2019
Authors:  张宇佳
Adobe PDF(48735Kb)  |  Favorite  |  View/Download:51/6  |  Submit date:2019/06/21
视频摘要  机器⼈学习  机器视觉  机械臂抓取控制  
Read, Watch, Listen, and Summarize: Multi-Modal Summarization for Asynchronous Text, Image, Audio and Video 期刊论文
IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2019, 卷号: 31, 期号: 5, 页码: 996-1009
Authors:  Li, Haoran;  Zhu, Junnan;  Ma, Cong;  Zhang, Jiajun;  Zong, Chengqing
View  |  Adobe PDF(2826Kb)  |  Favorite  |  View/Download:13/0  |  Submit date:2019/07/12
Summarization  multimedia  multi-modal  cross-modal  natural language processing  computer vision