验证码:

换一张

忘记密码？记住我

取消登录

切换中国科技网通行证登录

切换中国科技网通行证登录

取消

中文版 | English

中国科学院自动化研究所机构知识库

Knowledge Commons of Institute of Automation，CAS

登录注册

图片搜索

粘贴图片网址

首页
研究单元&专题
作者
文献类型
知识图谱
新闻&公告

在结果中检索

研究单元&专题

多模态人工智能系统全... [5]

紫东太初大模型研究中... [1]

作者

文献类型

期刊论文 [6]

发表日期

语种

出处

IEEE-ACM T... [2]

JOURNAL OF... [2]

IEEE Trans... [1]

信息安全学报 [1]

资助项目

Huawei Noa... [1]

Inria-CAS ... [1]

Key Resear... [1]

National K... [1]

National K... [1]

National N... [1]

收录类别

SCI [5]

EI [1]

导师

资助机构

Huawei Noa... [1]

Inria-CAS ... [1]

Key Resear... [1]

National K... [1]

National K... [1]

National N... [1]

知识图谱

CASIA OpenIR

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共6条，第1-6条

帮助

限定条件

文献类型：期刊论文

已选(0)清除条数/页：排序方式：
	Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation 期刊论文 IEEE Transactions on Multimedia, 2023, 卷号: 26, 页码: 1 - 13 作者: Liu, Jiawei; Wang, Weining; Chen, Sihan; Zhu, Xinxin; Liu, Jing Adobe PDF(7741Kb) \| 收藏 \| 浏览/下载：112/20 \| 提交时间：2023/05/03 Text-guided sounding-video generation Videoaudio representation Contrastive learning Transformer
	NeuralDPS: Neural Deterministic Plus Stochastic Model With Multiband Excitation for Noise-Controllable Waveform Generation 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 865-878 作者: Wang, Tao; Fu, Ruibo; Yi, Jiangyan; Tao, Jianhua; Wen, Zhengqi 收藏 \| 浏览/下载：228/0 \| 提交时间：2022/06/06 Vocoders Stochastic processes Neural networks Speech processing Signal to noise ratio Acoustics Speech enhancement Vocoder speech synthesis deterministic plus stochastic multiband excitation noise control
	CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文 IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254 作者: Wang, Tao; Yi, Jiangyan; Fu, Ruibo; Tao, Jianhua; Wen, Zhengqi 收藏 \| 浏览/下载：182/0 \| 提交时间：2022/09/19 Speech processing Decoding Predictive models Acoustics Transfer learning Training Task analysis Coarse-to-fine decoding mask prediction one-shot learning text-based speech editing text-to-speech
	语音伪造与鉴伪的发展与挑战期刊论文信息安全学报, 2020, 卷号: 5, 期号: 2, 页码: 28-38 作者: 陶建华; 傅睿博; 易江燕; 王成龙; 汪涛浏览 \| Adobe PDF(432Kb) \| 收藏 \| 浏览/下载：580/104 \| 提交时间：2020/06/27 语音伪造语音鉴伪发展与挑战
	Improving Deep Neural Network Based Speech Synthesis through Contextual Feature Parametrization and Multi-Task Learning 期刊论文 JOURNAL OF SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY, 2018, 卷号: 90, 期号: 7, 页码: 1025-1037 作者: Wen, Zhengqi; Li, Kehuang; Huang, Zhen; Lee, Chin-Hui; Tao, Jianhua; Zhengqi Wen 收藏 \| 浏览/下载：87/0 \| 提交时间：2020/10/27 Dnn-based Speech Synthesis Vocoder Speech Parametrization Blstm Phoneme Embedded Vector Multi-task Learning Pitch-scaled Spectrum
	Pitch-Scaled Spectrum Based Excitation Model for HMM-based Speech Synthesis 期刊论文 JOURNAL OF SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY, 2014, 卷号: 74, 期号: 3, 页码: 423-435 作者: Wen, Zhengqi; Tao, Jianhua; Pan, Shifeng; Wang, Yang; Zhengqi Wen 收藏 \| 浏览/下载：16/0 \| 提交时间：2020/10/27 Speech Synthesis Hmm-based Speech Synthesis Parametric Representation Of Speech Excitation Model Pitch-scaled Spectrum

首页
研究单元产出分布图
收录类型分布图
论文引用排行
作者
文献类型
学科分类
关于网站
使用帮助
联系我们

条目量24467
全文量12297
访问量5024314
下载量799256

版权所有 @2018 - 2024 中国科学院自动化研究所 - Powered by CSpace

地址邮编: 北京市海淀区中关村东路95号（100190）
电话: 010－82544495