CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
ReasonChainQA: Text-based Complex Question Answering with Explainable Evidence Chains 会议论文
, 中国厦门, 2022
作者:  Zhu MJ(朱敏郡);  Weng YX(翁诣轩);  He SZ(何世柱);  Liu K(刘康);  Zhao J(赵军)
Adobe PDF(456Kb)  |  收藏  |  浏览/下载:73/18  |  提交时间:2023/06/29
Audio-driven Dubbing for User Generated Contents via Style-aware Semi-parametric Synthesis 期刊论文
IEEE Transactions on Circuits and Systems for Video Technology, 2022, 卷号: 33, 期号: 3, 页码: 1247 - 1261
作者:  Song LS(宋林森);  Wu WY(吴文岩);  Fu CY(傅朝友);  Loy, Chen Change;  He R(赫然)
Adobe PDF(8629Kb)  |  收藏  |  浏览/下载:109/46  |  提交时间:2023/06/29
Talking Face Generation  Video Generation  GAN  Thin-plate Spline  
Everybody’s Talkin’: Let Me Talk as You Want 期刊论文
IEEE Transactions on Information Forensics and Security, 2022, 卷号: 17, 期号: 1, 页码: 585 - 598
作者:  宋林森;  吴文岩;  钱晨;  赫然;  Loy, Chen Change
Adobe PDF(15432Kb)  |  收藏  |  浏览/下载:68/11  |  提交时间:2023/06/29
Talking face generation  Video generation  GAN  Audio dubbing  
Joint Modeling of Document and Label with Clause Interaction Hypergraph for ICD Medical Code Assignment 会议论文
, Padua, Italy, 18-23 July 2022
作者:  Wu HR(吴浩然);  Meng LH(孟令辉);  Xu S(徐爽);  Xu B(徐波)
Adobe PDF(612Kb)  |  收藏  |  浏览/下载:84/32  |  提交时间:2023/06/26
DesignerGAN: Sketch Your Own Photo 会议论文
, Montreal, Canada, 2022-8-24
作者:  Binghao Zhao;  Tianxiang Ma;  Bo Peng;  Jing Dong
Adobe PDF(8752Kb)  |  收藏  |  浏览/下载:68/14  |  提交时间:2023/05/25
Meta Graph Transformer: A Novel Framework for Spatial-Temporal Traffic Prediction 期刊论文
NEUROCOMPUTING, 2022, 卷号: 491, 页码: 544-563
作者:  Ye, Xue;  Fang, Shen;  Sun, Fang;  Zhang, Chunxia;  Xiang, Shiming
Adobe PDF(3491Kb)  |  收藏  |  浏览/下载:216/25  |  提交时间:2022/09/19
Traffic prediction  Spatial-temporal modeling  Meta-learning  Attention mechanism  Deep learning  
Visuals to Text: A Comprehensive Review on Automatic Image Captioning 期刊论文
IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 8, 页码: 1339-1365
作者:  Yue Ming;  Nannan Hu;  Chunxiao Fan;  Fan Feng;  Jiangwan Zhou;  Hui Yu
Adobe PDF(56128Kb)  |  收藏  |  浏览/下载:151/21  |  提交时间:2022/08/01
Artificial intelligence  attention mechanism  encoder-decoder framework  image captioning  multi-modal understanding  training strategies  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1123/15  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
面向跨领域场景的句子匹配关键技术研究 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  白桂荣
Adobe PDF(3950Kb)  |  收藏  |  浏览/下载:218/10  |  提交时间:2022/06/14
自然语言处理,句子匹配,跨领域场景,领域自适应  
Key point localization and recurrent neural network based water meter reading recognition 期刊论文
Displays, 2022, 卷号: 74, 期号: 2022, 页码: 0-0
作者:  Jiguang Zhang;  Wenrui Liu;  Shibiao Xu;  Xiaopeng Zhang
Adobe PDF(4271Kb)  |  收藏  |  浏览/下载:193/43  |  提交时间:2022/05/06
Mechanical water meters reading  Reading region detection  Digit wheels recognition  Key point location  Recurrent convolutional network