已选(0)清除
条数/页: 排序方式: |
| ReasonChainQA: Text-based Complex Question Answering with Explainable Evidence Chains 会议论文 , 中国厦门, 2022 作者: Zhu MJ(朱敏郡); Weng YX(翁诣轩); He SZ(何世柱); Liu K(刘康); Zhao J(赵军) Adobe PDF(456Kb)  |  收藏  |  浏览/下载:73/18  |  提交时间:2023/06/29 |
| Audio-driven Dubbing for User Generated Contents via Style-aware Semi-parametric Synthesis 期刊论文 IEEE Transactions on Circuits and Systems for Video Technology, 2022, 卷号: 33, 期号: 3, 页码: 1247 - 1261 作者: Song LS(宋林森); Wu WY(吴文岩); Fu CY(傅朝友); Loy, Chen Change; He R(赫然) Adobe PDF(8629Kb)  |  收藏  |  浏览/下载:109/46  |  提交时间:2023/06/29 Talking Face Generation Video Generation GAN Thin-plate Spline |
| Everybody’s Talkin’: Let Me Talk as You Want 期刊论文 IEEE Transactions on Information Forensics and Security, 2022, 卷号: 17, 期号: 1, 页码: 585 - 598 作者: 宋林森; 吴文岩; 钱晨; 赫然; Loy, Chen Change Adobe PDF(15432Kb)  |  收藏  |  浏览/下载:68/11  |  提交时间:2023/06/29 Talking face generation Video generation GAN Audio dubbing |
| Joint Modeling of Document and Label with Clause Interaction Hypergraph for ICD Medical Code Assignment 会议论文 , Padua, Italy, 18-23 July 2022 作者: Wu HR(吴浩然); Meng LH(孟令辉); Xu S(徐爽); Xu B(徐波) Adobe PDF(612Kb)  |  收藏  |  浏览/下载:84/32  |  提交时间:2023/06/26 |
| DesignerGAN: Sketch Your Own Photo 会议论文 , Montreal, Canada, 2022-8-24 作者: Binghao Zhao; Tianxiang Ma; Bo Peng; Jing Dong Adobe PDF(8752Kb)  |  收藏  |  浏览/下载:68/14  |  提交时间:2023/05/25 |
| Meta Graph Transformer: A Novel Framework for Spatial-Temporal Traffic Prediction 期刊论文 NEUROCOMPUTING, 2022, 卷号: 491, 页码: 544-563 作者: Ye, Xue; Fang, Shen; Sun, Fang; Zhang, Chunxia; Xiang, Shiming Adobe PDF(3491Kb)  |  收藏  |  浏览/下载:216/25  |  提交时间:2022/09/19 Traffic prediction Spatial-temporal modeling Meta-learning Attention mechanism Deep learning |
| Visuals to Text: A Comprehensive Review on Automatic Image Captioning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2022, 卷号: 9, 期号: 8, 页码: 1339-1365 作者: Yue Ming; Nannan Hu; Chunxiao Fan; Fan Feng; Jiangwan Zhou; Hui Yu Adobe PDF(56128Kb)  |  收藏  |  浏览/下载:151/21  |  提交时间:2022/08/01 Artificial intelligence attention mechanism encoder-decoder framework image captioning multi-modal understanding training strategies |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1123/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |
| 面向跨领域场景的句子匹配关键技术研究 学位论文 工学博士学位, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 白桂荣 Adobe PDF(3950Kb)  |  收藏  |  浏览/下载:218/10  |  提交时间:2022/06/14 自然语言处理,句子匹配,跨领域场景,领域自适应 |
| Key point localization and recurrent neural network based water meter reading recognition 期刊论文 Displays, 2022, 卷号: 74, 期号: 2022, 页码: 0-0 作者: Jiguang Zhang; Wenrui Liu; Shibiao Xu; Xiaopeng Zhang Adobe PDF(4271Kb)  |  收藏  |  浏览/下载:193/43  |  提交时间:2022/05/06 Mechanical water meters reading Reading region detection Digit wheels recognition Key point location Recurrent convolutional network |