CASIA OpenIR

浏览/检索结果: 共30条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于i向量和变分自编码相对生成对抗网络的语音转换 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1824-1833
作者:  李燕萍;  曹盼;  左宇涛;  张燕;  钱博
Adobe PDF(5653Kb)  |  收藏  |  浏览/下载:1/1  |  提交时间:2024/05/20
语音转换  相对生成对抗网络  i向量  非平行文本  变分自编码器  多对多  
Spoken Content and Voice Factorization for Few-shot Speaker Adaptation 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(1514Kb)  |  收藏  |  浏览/下载:77/28  |  提交时间:2023/08/07
CONTEXT-AWARE MASK PREDICTION NETWORK FOR END-TO-END TEXT-BASED SPEECH EDITING 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2851Kb)  |  收藏  |  浏览/下载:77/38  |  提交时间:2023/08/07
The NLPR Speech Synthesis entry for Blizzard Challenge 2020 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(305Kb)  |  收藏  |  浏览/下载:66/34  |  提交时间:2023/08/07
Singing-Tacotron: Global Duration Control Attention and Dynamic Filter for End-to-end Singing Voice Synthesis 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2873Kb)  |  收藏  |  浏览/下载:56/22  |  提交时间:2023/08/07
Bi-level Speaker Supervision for One-shot Speech Synthesis 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(659Kb)  |  收藏  |  浏览/下载:41/20  |  提交时间:2023/08/07
基于受限样本的语音合成方法研究 学位论文
, 2023
作者:  汪涛
Adobe PDF(10568Kb)  |  收藏  |  浏览/下载:122/4  |  提交时间:2023/06/08
语音合成,声学建模,风格参数解耦,上下文风格感知,多风格声码器  
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文
IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13
作者:  Liu, Jiawei;  Wang, Weining;  Chen, Sihan;  Zhu, Xinxin;  Liu, Jing
Adobe PDF(7741Kb)  |  收藏  |  浏览/下载:133/24  |  提交时间:2023/05/03
Text-guided sounding-video generation  Videoaudio representation  Contrastive learning  Transformer  
CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254
作者:  Wang, Tao;  Yi, Jiangyan;  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi
收藏  |  浏览/下载:212/0  |  提交时间:2022/09/19
Speech processing  Decoding  Predictive models  Acoustics  Transfer learning  Training  Task analysis  Coarse-to-fine decoding  mask prediction  one-shot learning  text-based speech editing  text-to-speech  
基于连续学习的生成语音检测方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2022
作者:  马浩鑫
Adobe PDF(4018Kb)  |  收藏  |  浏览/下载:181/3  |  提交时间:2022/06/18
生成语音检测,连续学习,知识蒸馏,样例回放