CASIA OpenIR
(本次检索基于用户作品认领结果)

浏览/检索结果: 共18条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
SceneFake: An initial dataset and benchmarks for scene fake audio detection 期刊论文
PATTERN RECOGNITION, 2024, 卷号: 152, 页码: 12
作者:  Yi, Jiangyan;  Wang, Chenglong;  Tao, Jianhua;  Zhang, Chu Yuan;  Fan, Cunhang;  Tian, Zhengkun;  Ma, Haoxin;  Fu, Ruibo
收藏  |  浏览/下载:14/0  |  提交时间:2024/07/04
Scene manipulation  Fake audio detection  Speech enhancement  SceneFake dateset  
Emotion selectable end-to-end text-based speech editing 期刊论文
ARTIFICIAL INTELLIGENCE, 2024, 卷号: 329, 页码: 16
作者:  Wang, Tao;  Yi, Jiangyan;  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi;  Zhang, Chu Yuan
收藏  |  浏览/下载:10/0  |  提交时间:2024/07/03
Emotion selectable  Text-based speech editing  Emotion decoupling  Mask prediction  Few-shot learning  Text-to-speech  
Adversarial Multi-Task Learning for Mandarin Prosodic Boundary Prediction With Multi-Modal Embeddings 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2023, 卷号: 31, 页码: 2963-2973
作者:  Yi, Jiangyan;  Tao, Jianhua;  Fu, Ruibo;  Wang, Tao;  Zhang, Chu Yuan;  Wang, Chenglong
收藏  |  浏览/下载:77/0  |  提交时间:2023/11/17
Adversarial training  multi-task learning  prosodic boundaries  speech synthesis  multi-modal embeddings  
CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254
作者:  Wang, Tao;  Yi, Jiangyan;  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi
收藏  |  浏览/下载:242/0  |  提交时间:2022/09/19
Speech processing  Decoding  Predictive models  Acoustics  Transfer learning  Training  Task analysis  Coarse-to-fine decoding  mask prediction  one-shot learning  text-based speech editing  text-to-speech  
NeuralDPS: Neural Deterministic Plus Stochastic Model With Multiband Excitation for Noise-Controllable Waveform Generation 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 865-878
作者:  Wang, Tao;  Fu, Ruibo;  Yi, Jiangyan;  Tao, Jianhua;  Wen, Zhengqi
收藏  |  浏览/下载:285/0  |  提交时间:2022/06/06
Vocoders  Stochastic processes  Neural networks  Speech processing  Signal to noise ratio  Acoustics  Speech enhancement  Vocoder  speech synthesis  deterministic plus stochastic  multiband excitation  noise control  
一种改进的基于分析合成框架的语音增强算法 会议论文
, 中国天津, 20151025-20151026
作者:  刘斌;  陶建华;  莫福源
收藏  |  浏览/下载:42/0  |  提交时间:2020/10/27
The NLPR Speech Synthesis entry for Blizzard Challenge 2017 会议论文
, Stockholm, Sweden, 2017.8.25
作者:  Jianhua Tao;  Ruibo Fu;  Yibin Zheng;  Zhengqi Wen;  Ya Li;  Biu Liu
收藏  |  浏览/下载:91/0  |  提交时间:2020/10/27
面向窄带通信的极低速率语音编码算法研究 期刊论文
信号处理, 2013, 期号: 9, 页码: 1134-1138
作者:  刘斌;  陶建华;  莫福源
收藏  |  浏览/下载:158/0  |  提交时间:2020/10/27
联合矢量量化  非线性量化  预测残差  听觉感知  
Micro-Expression Recognition Using Color Spaces 期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2015, 卷号: 24, 期号: 12, 页码: 6034-6047
作者:  Wang, Su-Jing;  Yan, Wen-Jing;  Li, Xiaobai;  Zhao, Guoying;  Zhou, Chun-Guang;  Fu, Xiaolan;  Yang, Minghao;  Tao, Jianhua
收藏  |  浏览/下载:138/0  |  提交时间:2020/10/27
Micro-expression Recognition  Color Spaces  Tensor Analysis  Local Binary Patterns  Facial Action Coding System  
一种语音数据的编码及解码方法 专利
专利类型: 发明专利, 专利号: CN201310176701.6, 申请日期: 2013-05-14, 公开日期: 2013-08-14
发明人:  陶建华;  刘斌;  莫福源
收藏  |  浏览/下载:45/0  |  提交时间:2020/10/27