已选(0)清除
条数/页: 排序方式: |
| Second-Order Global Attention Networks for Graph Classification and Regression 会议论文 , Beijing, China, August 27-28, 2022 作者: Hu Fenyu; Cui Zeyu; Wu Shu; Liu Qiang; Wu Jinlin; Wang Liang; Tan Tieniu Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:188/69  |  提交时间:2023/07/06 |
| Audio-driven Dubbing for User Generated Contents via Style-aware Semi-parametric Synthesis 期刊论文 IEEE Transactions on Circuits and Systems for Video Technology, 2022, 卷号: 33, 期号: 3, 页码: 1247 - 1261 作者: Song LS(宋林森); Wu WY(吴文岩); Fu CY(傅朝友); Loy, Chen Change; He R(赫然) Adobe PDF(8629Kb)  |  收藏  |  浏览/下载:113/47  |  提交时间:2023/06/29 Talking Face Generation Video Generation GAN Thin-plate Spline |
| Everybody’s Talkin’: Let Me Talk as You Want 期刊论文 IEEE Transactions on Information Forensics and Security, 2022, 卷号: 17, 期号: 1, 页码: 585 - 598 作者: 宋林森; 吴文岩; 钱晨; 赫然; Loy, Chen Change Adobe PDF(15432Kb)  |  收藏  |  浏览/下载:79/11  |  提交时间:2023/06/29 Talking face generation Video generation GAN Audio dubbing |
| IMPROVING CROSS-MODAL UNDERSTANDING IN VISUAL DIALOG VIA CONTRASTIVE LEARNING 会议论文 , Singapore, 2022.5 作者: Feilong Chen; Duzhen Zhang; Xiuyi Chen; Jing Shi; Shuang Xu; Bo Xu Adobe PDF(9035Kb)  |  收藏  |  浏览/下载:210/91  |  提交时间:2023/06/07 |
| Unsupervised and Pseudo-Supervised Vision-Language Alignment in Visual Dialog 会议论文 , Lisboa, Portugal, October 10–14, 2022 作者: Feilong Chen; Duzhen Zhang; Xiuyi Chen; Jing Shi; Shang Xu; Bo Xu Adobe PDF(9035Kb)  |  收藏  |  浏览/下载:243/147  |  提交时间:2023/06/05 |
| Many Hands Make Light Work: Transferring Knowledge from Auxiliary Tasks for Video-Text Retrieval 期刊论文 IEEE Transactions on Multimedia, 2022, 页码: 1-15 作者: Wang, Wei; Gao, Junyu; Yang, Xiaoshan; Xu, Changsheng Adobe PDF(3679Kb)  |  收藏  |  浏览/下载:112/20  |  提交时间:2023/04/25 |
| 会议场景智能语音处理技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 范志赟 Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:252/11  |  提交时间:2022/09/15 会议场景,语音识别,说话人转换点检测,说话人自适应 |
| 面向低功耗的语音增强与分离算法研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 黄雅婷 Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:316/17  |  提交时间:2022/09/14 语音增强与分离 脉冲神经网络 模型压缩 听觉感知恢复 |
| 知识与数据协同驱动的异质图像表示与合成 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2022 作者: 骆曼迪 Adobe PDF(10423Kb)  |  收藏  |  浏览/下载:301/15  |  提交时间:2022/08/08 知识与数据协同驱动 异质图像表示 异质图像合成 异质图像转换 生成对抗网络 信息瓶颈 |
| 从视频到语言:视频描述和标题生成方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 张子琦 Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1134/15  |  提交时间:2022/06/16 视觉与语言 视频内容描述 视频标题生成 外部语言模型 开卷视频描述 中文短视频-文本基准 大规模多模态预训练 |