已选(0)清除
条数/页: 排序方式: |
| Transformer: A General Framework from Machine Translation to Others 期刊论文 Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538 作者: Yang Zhao; Jiajun Zhang; Chengqing Zong Adobe PDF(1415Kb)  |  收藏  |  浏览/下载:6/1  |  提交时间:2024/04/23 Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT |
| Spoken Content and Voice Factorization for Few-shot Speaker Adaptation 会议论文 , Online, 2020 作者: Wang T(汪涛) Adobe PDF(1514Kb)  |  收藏  |  浏览/下载:70/27  |  提交时间:2023/08/07 |
| PROSODY AND VOICE FACTORIZATION FOR FEW-SHOT SPEAKER ADAPTATION IN THE CHALLENGE M2VOC 2021 会议论文 , Online, 2021 作者: Wang T(汪涛) Adobe PDF(818Kb)  |  收藏  |  浏览/下载:99/43  |  提交时间:2023/08/07 |
| CONTEXT-AWARE MASK PREDICTION NETWORK FOR END-TO-END TEXT-BASED SPEECH EDITING 会议论文 , Online, 2022 作者: Wang T(汪涛) Adobe PDF(2851Kb)  |  收藏  |  浏览/下载:71/35  |  提交时间:2023/08/07 |
| 个性化语音合成中说话人特征不同嵌入方式的研究 会议论文 , 中国青海, 2019 作者: 汪涛 Adobe PDF(416Kb)  |  收藏  |  浏览/下载:59/36  |  提交时间:2023/08/07 |
| The NLPR Speech Synthesis entry for Blizzard Challenge 2020 会议论文 , Online, 2020 作者: Wang T(汪涛) Adobe PDF(305Kb)  |  收藏  |  浏览/下载:64/33  |  提交时间:2023/08/07 |
| Bi-level Speaker Supervision for One-shot Speech Synthesis 会议论文 , Online, 2020 作者: Wang T(汪涛) Adobe PDF(659Kb)  |  收藏  |  浏览/下载:37/18  |  提交时间:2023/08/07 |
| 面向对话文本的自动摘要关键技术研究 学位论文 , 2023 作者: 林海涛 Adobe PDF(6631Kb)  |  收藏  |  浏览/下载:145/9  |  提交时间:2023/06/12 对话摘要 数据标注 无监督方法 角色交互 多任务学习 |
| 基于受限样本的语音合成方法研究 学位论文 , 2023 作者: 汪涛 Adobe PDF(10568Kb)  |  收藏  |  浏览/下载:114/4  |  提交时间:2023/06/08 语音合成,声学建模,风格参数解耦,上下文风格感知,多风格声码器 |
| CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254 作者: Wang, Tao; Yi, Jiangyan; Fu, Ruibo; Tao, Jianhua; Wen, Zhengqi 收藏  |  浏览/下载:199/0  |  提交时间:2022/09/19 Speech processing Decoding Predictive models Acoustics Transfer learning Training Task analysis Coarse-to-fine decoding mask prediction one-shot learning text-based speech editing text-to-speech |