CASIA OpenIR

浏览/检索结果: 共34条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于连续学习的生成语音检测方法研究 学位论文
, 中科院自动化研究所: 中国科学院大学, 2022
作者:  马浩鑫
Adobe PDF(4018Kb)  |  收藏  |  浏览/下载:206/3  |  提交时间:2022/06/18
生成语音检测,连续学习,知识蒸馏,样例回放  
面向信息网络的表示与关联方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  车飞虎
Adobe PDF(8695Kb)  |  收藏  |  浏览/下载:172/8  |  提交时间:2022/06/17
信息网络  网络表示学习  自举机制  对比学习  负样本采样  
端到端中英混合语音识别方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学人工智能学院, 2022
作者:  张帅
Adobe PDF(2551Kb)  |  收藏  |  浏览/下载:288/18  |  提交时间:2022/06/17
端到端语音识别  中英混合  语种语音联合建模  多语上下文  语义一致性  
面向交互场景的情感识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  连政
Adobe PDF(4140Kb)  |  收藏  |  浏览/下载:217/15  |  提交时间:2021/06/16
交互场景  情感识别  情感特征提取  多模态融合  个体信息建模  
基于语言知识迁移的端到端语音识别方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  白烨
Adobe PDF(7085Kb)  |  收藏  |  浏览/下载:248/12  |  提交时间:2021/06/01
端到端语音识别、迁移学习、知识蒸馏、老师-学生学习、BERT、非自回归语音识别  
基于音视频的自动抑郁检测研究 学位论文
, 北京: 中国科学院自动化研究所, 2021
作者:  牛明月
Adobe PDF(3264Kb)  |  收藏  |  浏览/下载:251/7  |  提交时间:2021/06/01
多模态抑郁检测  面部纹理细节  MFCC的时空属性  池化的范数类型  关键的音视频帧  注意力机制  模态互补信息  
基于多域听觉特征建模的说话人无关语音分离方法研究 学位论文
, 北京市: 中国科学院自动化研究所, 2021
作者:  范存航
Adobe PDF(3377Kb)  |  收藏  |  浏览/下载:270/12  |  提交时间:2021/06/01
说话人无关语音分离  听觉特征建模  深度嵌入式特征  深度注意力融合特征  门控递归融合  
基于迁移学习的小数据语音声学模型研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  易江燕
Adobe PDF(2091Kb)  |  收藏  |  浏览/下载:340/38  |  提交时间:2018/05/31
迁移学习  小语种  口音自适应  声学模型  语音识别  
基于WFST的语音识别解码优化研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  倪浩
Adobe PDF(3436Kb)  |  收藏  |  浏览/下载:1156/5  |  提交时间:2017/06/08
语音识别  Wfst  解码  Rnn  自适应  
语音驱动发音器官运动可视化及差异分析研究 学位论文
, 北京: 中国科学院大学, 2017
作者:  张大伟
Adobe PDF(3370Kb)  |  收藏  |  浏览/下载:328/5  |  提交时间:2017/06/02
可视语音  医学图像处理  发音器官轮廓提取  组合深度神经网络  弹性转换模型