CASIA OpenIR

浏览/检索结果: 共106条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于受限样本的语音合成方法研究 学位论文
, 2023
作者:  汪涛
Adobe PDF(10568Kb)  |  收藏  |  浏览/下载:109/4  |  提交时间:2023/06/08
语音合成,声学建模,风格参数解耦,上下文风格感知,多风格声码器  
面向对话文本的自动摘要关键技术研究 学位论文
, 2023
作者:  林海涛
Adobe PDF(6631Kb)  |  收藏  |  浏览/下载:140/9  |  提交时间:2023/06/12
对话摘要  数据标注  无监督方法  角色交互  多任务学习  
Transformer: A General Framework from Machine Translation to Others 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 514-538
作者:  Yang Zhao
Adobe PDF(1415Kb)  |  收藏  |  浏览/下载:97/30  |  提交时间:2023/08/02
Neural machine translation, Transformer, document neural machine translation (NMT), multimodal NMT, low-resource NMT  
CONTEXT-AWARE MASK PREDICTION NETWORK FOR END-TO-END TEXT-BASED SPEECH EDITING 会议论文
, Online, 2022
作者:  Wang T(汪涛)
Adobe PDF(2851Kb)  |  收藏  |  浏览/下载:65/33  |  提交时间:2023/08/07
CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing 期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254
作者:  Wang, Tao;  Yi, Jiangyan;  Fu, Ruibo;  Tao, Jianhua;  Wen, Zhengqi
收藏  |  浏览/下载:181/0  |  提交时间:2022/09/19
Speech processing  Decoding  Predictive models  Acoustics  Transfer learning  Training  Task analysis  Coarse-to-fine decoding  mask prediction  one-shot learning  text-based speech editing  text-to-speech  
PROSODY AND VOICE FACTORIZATION FOR FEW-SHOT SPEAKER ADAPTATION IN THE CHALLENGE M2VOC 2021 会议论文
, Online, 2021
作者:  Wang T(汪涛)
Adobe PDF(818Kb)  |  收藏  |  浏览/下载:93/41  |  提交时间:2023/08/07
跨模态信息融合的语音翻译方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  刘宇宸
Adobe PDF(2516Kb)  |  收藏  |  浏览/下载:230/13  |  提交时间:2021/06/21
语音翻译  语音识别  机器翻译  多模态学习  
A time-frequency channel attention and vectorization network for automatic depression level prediction 期刊论文
Neurocomputing, 2021, 期号: 450, 页码: 208-218
作者:  Mingyue Niu;  Bin Liu;  Jianhua Tao;  Qifei Li
Adobe PDF(2001Kb)  |  收藏  |  浏览/下载:156/42  |  提交时间:2021/06/01
Sphere embedding normalization  DenseNet  Transition layer  Time-frequency channel attention block  Time-frequency vectorization block  Depression detection  
基于神经科学文献感兴趣片段的跨物种脑认知知识图谱自动构建 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  朱洪银
Adobe PDF(8378Kb)  |  收藏  |  浏览/下载:346/7  |  提交时间:2020/06/19
脑科学  跨物种  神经信息学  知识图谱  知识引擎  感兴趣片段  语料标注  术语识别  关系抽取  深度学习  
个性化语音合成方法研究 学位论文
, 中国科学院大学: 中国科学院大学, 2020
作者:  傅睿博
Adobe PDF(3985Kb)  |  收藏  |  浏览/下载:419/17  |  提交时间:2020/06/21
语音合成  个性化定制  声学建模  说话人特征空间建模  韵律建模