CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Spoken Content and Voice Factorization for Few-shot Speaker Adaptation 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(1514Kb)  |  收藏  |  浏览/下载:72/27  |  提交时间:2023/08/07
CONTEXT-AWARE MASK PREDICTION NETWORK FOR END-TO-END TEXT-BASED SPEECH EDITING 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2851Kb)  |  收藏  |  浏览/下载:72/35  |  提交时间:2023/08/07
The NLPR Speech Synthesis entry for Blizzard Challenge 2020 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(305Kb)  |  收藏  |  浏览/下载:64/33  |  提交时间:2023/08/07
Bi-level Speaker Supervision for One-shot Speech Synthesis 会议论文
, Online, 2020
作者:  Wang T(汪涛)
Adobe PDF(659Kb)  |  收藏  |  浏览/下载:37/18  |  提交时间:2023/08/07
CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254
作者:  Wang, Tao;  Yi, Jiangyan;  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi
收藏  |  浏览/下载:203/0  |  提交时间:2022/09/19
Speech processing  Decoding  Predictive models  Acoustics  Transfer learning  Training  Task analysis  Coarse-to-fine decoding  mask prediction  one-shot learning  text-based speech editing  text-to-speech  
跨模态信息融合的语音翻译方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  刘宇宸
Adobe PDF(2516Kb)  |  收藏  |  浏览/下载:232/13  |  提交时间:2021/06/21
语音翻译  语音识别  机器翻译  多模态学习  
A time-frequency channel attention and vectorization network for automatic depression level prediction 期刊论文
Neurocomputing, 2021, 期号: 450, 页码: 208-218
作者:  Mingyue Niu;  Bin Liu;  Jianhua Tao;  Qifei Li
Adobe PDF(2001Kb)  |  收藏  |  浏览/下载:170/46  |  提交时间:2021/06/01
Sphere embedding normalization  DenseNet  Transition layer  Time-frequency channel attention block  Time-frequency vectorization block  Depression detection  
Focal Loss for Punctuation Prediction 会议论文
, 北京,中国, 2020.10.25-2020.10.29
作者:  Jiangyan Yi;  Jianhua Tao;  Zhengkun Tian;  Ye Bai;  Cunhang Fan
浏览  |  Adobe PDF(247Kb)  |  收藏  |  浏览/下载:171/54  |  提交时间:2020/10/22
Language-invariant Bottleneck Features from Adversarial End-to-end Acoustic Models for Low Resource Speech Recognition 会议论文
, Brighton, UK, 2019.05.12-2019.05.18
作者:  Jiangyan Yi;  Jianhua Tao;  Ye Bai
浏览  |  Adobe PDF(295Kb)  |  收藏  |  浏览/下载:75/35  |  提交时间:2020/10/22
基于静音时长和文本特征融合的韵律边界自动标注 会议论文
, 江苏连云港, 2017-10
作者:  傅睿博;  李雅;  温正棋;  陶建华
浏览  |  Adobe PDF(877Kb)  |  收藏  |  浏览/下载:227/83  |  提交时间:2020/06/27