验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [16]

作者

易江燕 [16]

文献类型

期刊论文 [16]

发表日期

语种

出处

IEEE-ACM T... [8]

APPLIED AC... [2]

ARTIFICIAL... [1]

IEEE SIGNA... [1]

JOURNAL OF... [1]

NEURAL NET... [1]

资助项目

National N... [6]

National N... [6]

National N... [5]

Inria-CAS ... [4]

National N... [4]

National N... [3]

收录类别

SCI [16]

导师

资助机构

National ... [11]

Inria-CAS ... [4]

National K... [4]

Excellent ... [2]

National K... [2]

Open Proje... [2]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

（本次检索基于用户作品认领结果）

浏览/检索结果: 共16条，第1-10条

帮助

限定条件	收录类别：SCI 作者：易江燕第一作者

已选(0)清除条数/页：排序方式：
	Spatial reconstructed local attention Res2Net with F0 subband for fake speech detection 期刊论文 NEURAL NETWORKS, 2024, 卷号: 175, 页码: 11 作者: Fan, Cunhang; Xue, Jun; Tao, Jianhua; Yi, Jiangyan; Wang, Chenglong; Zheng, Chengshi; Lv, Zhao 收藏 \| 浏览/下载：11/0 \| 提交时间：2024/07/04 ASVspoof Fake speech detection Fundamental frequency Res2Net
	SceneFake: An initial dataset and benchmarks for scene fake audio detection 期刊论文 PATTERN RECOGNITION, 2024, 卷号: 152, 页码: 12 作者: Yi, Jiangyan; Wang, Chenglong; Tao, Jianhua; Zhang, Chu Yuan; Fan, Cunhang; Tian, Zhengkun; Ma, Haoxin; Fu, Ruibo 收藏 \| 浏览/下载：6/0 \| 提交时间：2024/07/04 Scene manipulation Fake audio detection Speech enhancement SceneFake dateset
	Emotion selectable end-to-end text-based speech editing 期刊论文 ARTIFICIAL INTELLIGENCE, 2024, 卷号: 329, 页码: 16 作者: Wang, Tao; Yi, Jiangyan; Fu, Ruibo; Tao, Jianhua; Wen, Zhengqi; Zhang, Chu Yuan 收藏 \| 浏览/下载：7/0 \| 提交时间：2024/07/03 Emotion selectable Text-based speech editing Emotion decoupling Mask prediction Few-shot learning Text-to-speech
	Subband fusion of complex spectrogram for fake speech detection 期刊论文 SPEECH COMMUNICATION, 2023, 卷号: 155, 页码: 8 作者: Fan, Cunhang; Xue, Jun; Dong, Shunbo; Ding, Mingming; Yi, Jiangyan; Li, Jinpeng; Lv, Zhao 收藏 \| 浏览/下载：49/0 \| 提交时间：2024/03/26 Automatic speaker verification Complex spectrogram Fake speech detection Phase information Subband
	Adversarial Multi-Task Learning for Mandarin Prosodic Boundary Prediction With Multi-Modal Embeddings 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2023, 卷号: 31, 页码: 2963-2973 作者: Yi, Jiangyan; Tao, Jianhua; Fu, Ruibo; Wang, Tao; Zhang, Chu Yuan; Wang, Chenglong 收藏 \| 浏览/下载：74/0 \| 提交时间：2023/11/17 Adversarial training multi-task learning prosodic boundaries speech synthesis multi-modal embeddings
	Two-stage deep spectrum fusion for noise-robust end-to-end speech recognition 期刊论文 APPLIED ACOUSTICS, 2023, 卷号: 212, 页码: 10 作者: Fan, Cunhang; Ding, Mingming; Yi, Jiangyan; Li, Jinpeng; Lv, Zhao 收藏 \| 浏览/下载：51/0 \| 提交时间：2023/11/16 Robust end-to-end ASR Speech enhancement Masking and mapping Speech distortion Deep spectrum fusion
	CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254 作者: Wang, Tao; Yi, Jiangyan; Fu, Ruibo; Tao, Jianhua; Wen, Zhengqi 收藏 \| 浏览/下载：241/0 \| 提交时间：2022/09/19 Speech processing Decoding Predictive models Acoustics Transfer learning Training Task analysis Coarse-to-fine decoding mask prediction one-shot learning text-based speech editing text-to-speech
	SpecMNet: Spectrum mend network for monaural speech enhancement 期刊论文 APPLIED ACOUSTICS, 2022, 卷号: 194, 页码: 9 作者: Fan, Cunhang; Zhang, Hongmei; Yi, Jiangyan; Lv, Zhao; Tao, Jianhua; Li, Taihao; Pei, Guanxiong; Wu, Xiaopei; Li, Sheng 收藏 \| 浏览/下载：260/0 \| 提交时间：2022/07/25 Monaural speech enhancement Speech distortion Spectrum mend network SI-SNR BLSTM
	Hybrid Autoregressive and Non-Autoregressive Transformer Models for Speech Recognition 期刊论文 IEEE SIGNAL PROCESSING LETTERS, 2022, 页码: 762-766 作者: Zhengkun Tian; Jiangyan Yi; Jianhua Tao; Shuai Zhang; Zhengqi Wen Adobe PDF(934Kb) \| 收藏 \| 浏览/下载：291/79 \| 提交时间：2022/06/14
	NeuralDPS: Neural Deterministic Plus Stochastic Model With Multiband Excitation for Noise-Controllable Waveform Generation 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 865-878 作者: Wang, Tao; Fu, Ruibo; Yi, Jiangyan; Tao, Jianhua; Wen, Zhengqi 收藏 \| 浏览/下载：283/0 \| 提交时间：2022/06/06 Vocoders Stochastic processes Neural networks Speech processing Signal to noise ratio Acoustics Speech enhancement Vocoder speech synthesis deterministic plus stochastic multiband excitation noise control

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25745
全文量13627
访问量5620754
下载量869395

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495