验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统... [58]

作者

陶建华 [58]

文献类型

会议论文 [39]

期刊论文 [19]

发表日期

语种

出处

IEEE-ACM T... [8]

JOURNAL OF... [2]

APPLIED AC... [1]

ARTIFICIAL... [1]

IEEE SIGNA... [1]

IEEE/ACM T... [1]

资助项目

National N... [6]

National N... [6]

National N... [5]

Inria-CAS ... [4]

National N... [4]

National N... [3]

收录类别

EI [20]

导师

资助机构

National N... [9]

Inria-CAS ... [4]

National K... [4]

Beijing Mu... [1]

Excellent ... [1]

Huawei Noa... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

（本次检索基于用户作品认领结果）

浏览/检索结果: 共58条，第1-10条

帮助

限定条件	作者：陶建华第一作者

已选(0)清除条数/页：排序方式：
	Spatial reconstructed local attention Res2Net with F0 subband for fake speech detection 期刊论文 NEURAL NETWORKS, 2024, 卷号: 175, 页码: 11 作者: Fan, Cunhang; Xue, Jun; Tao, Jianhua; Yi, Jiangyan; Wang, Chenglong; Zheng, Chengshi; Lv, Zhao 收藏 \| 浏览/下载：28/0 \| 提交时间：2024/07/04 ASVspoof Fake speech detection Fundamental frequency Res2Net
	SceneFake: An initial dataset and benchmarks for scene fake audio detection 期刊论文 PATTERN RECOGNITION, 2024, 卷号: 152, 页码: 12 作者: Yi, Jiangyan; Wang, Chenglong; Tao, Jianhua; Zhang, Chu Yuan; Fan, Cunhang; Tian, Zhengkun; Ma, Haoxin; Fu, Ruibo 收藏 \| 浏览/下载：23/0 \| 提交时间：2024/07/04 Scene manipulation Fake audio detection Speech enhancement SceneFake dateset
	Emotion selectable end-to-end text-based speech editing 期刊论文 ARTIFICIAL INTELLIGENCE, 2024, 卷号: 329, 页码: 16 作者: Wang, Tao; Yi, Jiangyan; Fu, Ruibo; Tao, Jianhua; Wen, Zhengqi; Zhang, Chu Yuan 收藏 \| 浏览/下载：19/0 \| 提交时间：2024/07/03 Emotion selectable Text-based speech editing Emotion decoupling Mask prediction Few-shot learning Text-to-speech
	Distinguishing Neural Speech Synthesis Models Through Fingerprints in Speech Waveforms 会议论文 , Taiyuan, Shanxi, China, 2024-07-27 作者: Zhang, Chu Yuan; Yi, Jiangyan; Tao, Jianhua; Wang, Chenglong; Yan, Xinrui Adobe PDF(2254Kb) \| 收藏 \| 浏览/下载：35/14 \| 提交时间：2024/06/26
	Multi-Scale Permutation Entropy for Audio Deepfake Detection 会议论文 , 韩国首尔, 2024-4-14 作者: Chenglong Wang; He JY(何佳毅); Jiangyan Yi; Jianhua Tao; Chu Yuan Zhang; Xiaohui Zhang Adobe PDF(997Kb) \| 收藏 \| 浏览/下载：65/22 \| 提交时间：2024/06/13
	GCC-Speaker: Target Speaker Localization with Optimal Speaker-Dependent Weighting in Multi-Speaker Scenarios 会议论文 , 希腊罗得岛, 2023年6月作者: Li GJ(李冠君); Liu WJ(刘文举); Yi JY(易江燕); Tao JH(陶建华) Adobe PDF(3463Kb) \| 收藏 \| 浏览/下载：42/14 \| 提交时间：2024/06/06
	MER 2023: Multi-label Learning, Modality Robustness, and Semi-Supervised Learning 会议论文 , Ottawa, ON, Canada, October 29-November 3, 2023 作者: Zheng Lian; Haiyang Sun; Licai Sun; Kang Chen; Mingyu Xu; Kexin Wang; Ke Xu; Yu He; Ying Li; Jinming Zhao; Ye Liu; Bin Liu; Jiangyan Yi; Meng Wang; Erik Cambria; Guoying Zhao; Björn W. Schuller; Jianhua Tao Adobe PDF(993Kb) \| 收藏 \| 浏览/下载：59/20 \| 提交时间：2024/05/31
	Adversarial Multi-Task Learning for Mandarin Prosodic Boundary Prediction With Multi-Modal Embeddings 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2023, 卷号: 31, 页码: 2963-2973 作者: Yi, Jiangyan; Tao, Jianhua; Fu, Ruibo; Wang, Tao; Zhang, Chu Yuan; Wang, Chenglong 收藏 \| 浏览/下载：86/0 \| 提交时间：2023/11/17 Adversarial training multi-task learning prosodic boundaries speech synthesis multi-modal embeddings
	CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254 作者: Wang, Tao; Yi, Jiangyan; Fu, Ruibo; Tao, Jianhua; Wen, Zhengqi 收藏 \| 浏览/下载：253/0 \| 提交时间：2022/09/19 Speech processing Decoding Predictive models Acoustics Transfer learning Training Task analysis Coarse-to-fine decoding mask prediction one-shot learning text-based speech editing text-to-speech
	SpecMNet: Spectrum mend network for monaural speech enhancement 期刊论文 APPLIED ACOUSTICS, 2022, 卷号: 194, 页码: 9 作者: Fan, Cunhang; Zhang, Hongmei; Yi, Jiangyan; Lv, Zhao; Tao, Jianhua; Li, Taihao; Pei, Guanxiong; Wu, Xiaopei; Li, Sheng 收藏 \| 浏览/下载：268/0 \| 提交时间：2022/07/25 Monaural speech enhancement Speech distortion Spectrum mend network SI-SNR BLSTM

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量25852
全文量13690
访问量5847884
下载量919893

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495