CASIA OpenIR

浏览/检索结果: 共16条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
CONTEXT-AWARE MASK PREDICTION NETWORK FOR END-TO-END TEXT-BASED SPEECH EDITING 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2851Kb)  |  收藏  |  浏览/下载:78/38  |  提交时间:2023/08/07
F-0-Noise-Robust Glottal Source and Vocal Tract Analysis Based on ARX-LF Model 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2021, 卷号: 29, 页码: 3375-3383
作者:  Li, Yongwei;  Tao, Jianhua;  Erickson, Donna;  Liu, Bin;  Akagi, Masato
收藏  |  浏览/下载:126/0  |  提交时间:2021/12/28
Speech recognition  Iterative methods  Production  Estimation  Brain modeling  Shape  Low-frequency noise  Glottal source  vocal tract  source-filter model  ARX-LF model  
Automatic Depression Level Detection via lp-norm Pooling 会议论文
, 奥地利格拉茨, 2019-9
作者:  Mingyue Niu;  Jianhua Tao;  Bin Liu;  Cunhang Fan
Adobe PDF(403Kb)  |  收藏  |  浏览/下载:102/31  |  提交时间:2021/06/01
A time-frequency channel attention and vectorization network for automatic depression level prediction 期刊论文
Neurocomputing, 2021, 期号: 450, 页码: 208-218
作者:  Mingyue Niu;  Bin Liu;  Jianhua Tao;  Qifei Li
Adobe PDF(2001Kb)  |  收藏  |  浏览/下载:182/51  |  提交时间:2021/06/01
Sphere embedding normalization  DenseNet  Transition layer  Time-frequency channel attention block  Time-frequency vectorization block  Depression detection  
Simultaneous Estimation of Glottal Source Waveforms and Vocal Tract Shapes from Speech Signals Based on ARX-LF Model 期刊论文
JOURNAL OF SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY, 2020, 卷号: 92, 期号: 8, 页码: 831-838
作者:  Li, Yongwei;  Sakakibara, Ken-Ichi;  Akagi, Masato
收藏  |  浏览/下载:180/0  |  提交时间:2020/08/03
Glottal source waveform  Vocal tract shape  ARX-LF model  
面向多模态序列数据的模式分类方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2020
作者:  谢龙飞
Adobe PDF(1957Kb)  |  收藏  |  浏览/下载:279/5  |  提交时间:2020/06/11
多模态模式识别  情感识别  异质数据融合  生成对抗网络  注意力机制  
面向数据失配的鲁棒性声学建模方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2020
作者:  刘斌
Adobe PDF(2027Kb)  |  收藏  |  浏览/下载:246/7  |  提交时间:2020/06/09
鲁棒性声学建模  语音识别  对抗学习  语音唤醒  
Attribute Knowledge Integration for Speech Recognition Based on Multi-task Learning Neural Networks 会议论文
INTERSPEECH, Dresden, Germany, 2015
作者:  Hao Zheng;  Zhanlei Yang;  Liwei Qiao;  Jianping Li;  Wenju Liu
浏览  |  Adobe PDF(388Kb)  |  收藏  |  浏览/下载:379/119  |  提交时间:2016/06/28
Multi-task Learning  Automatic Attribute Transcription  Deep Neural Networks  
Features importance analysis for emotional speech classification 期刊论文
AFFECTIVE COMPUTING AND INTELLIGENT INTERACTION, PROCEEDINGS, 2005, 卷号: 3784, 期号: 0, 页码: 449-457
作者:  Tao, JH;  Kang, YG;  Tao, J;  Picard, RW
浏览  |  Adobe PDF(188Kb)  |  收藏  |  浏览/下载:212/77  |  提交时间:2015/11/06
Emotionspeech  
面向参数语音合成声学建模 学位论文
, 中国科学院自动化研究所: 中国科学院研究生院, 2010
作者:  孙宏军
Adobe PDF(840Kb)  |  收藏  |  浏览/下载:169/2  |  提交时间:2015/09/02
声源激励  谱包络估计  韵律调节  谱平滑  语音参数量化  Source Exciting  Spectrum Envelop Estimation  Prosody Adjust  Spectrum Smooth  Speech Parameters Quantization