CASIA OpenIR

浏览/检索结果: 共16条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:300/17  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:242/11  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
智能对话系统中的知识表示、激活与利用研究 学位论文
工学博士, 中国科学院自动化研究所: casia, 2022
作者:  陈修意
Adobe PDF(5912Kb)  |  收藏  |  浏览/下载:261/15  |  提交时间:2022/06/14
对话系统,知识表示,知识对话生成  
面向语音翻译的文本规范化和端到端建模方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  董倩倩
Adobe PDF(4379Kb)  |  收藏  |  浏览/下载:273/11  |  提交时间:2021/06/24
语音翻译、级联系统、文本规范化、端到端模型  
基于回归方法的单目相机人脸重建研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  王鹏睿
Adobe PDF(7276Kb)  |  收藏  |  浏览/下载:368/9  |  提交时间:2020/09/10
三维人脸重建  弱监督学习  明暗成形  网格形变  单目相机  
基于循环神经网络的声学建模方法研究 学位论文
, 北京: 中国科学院大学, 2018
作者:  赵媛媛
Adobe PDF(4227Kb)  |  收藏  |  浏览/下载:383/11  |  提交时间:2018/06/13
声学建模  循环神经网络  多维残差学习  词打散  改进的低帧率模型  多场景中文语音识别  
基于深度神经网络的字幕行识别方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  翟传磊
Adobe PDF(6784Kb)  |  收藏  |  浏览/下载:282/2  |  提交时间:2017/06/22
深度神经网络  图像文本行识别  链接时序分类  注意力机制  
基于深度学习的语音识别声学模型建模方法研究 学位论文
, 北京: 中国科学院研究生院, 2016
作者:  李杰
Adobe PDF(5438Kb)  |  收藏  |  浏览/下载:563/14  |  提交时间:2016/06/23
深度学习  语音识别  声学模型建模  
电话信道下说话人分离及识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  张策
Adobe PDF(1685Kb)  |  收藏  |  浏览/下载:380/0  |  提交时间:2015/09/02
说话人识别  说话人分离  因子分析  高斯混合模型  贝叶斯分析  Speaker Recognition  Speaker Diarization  Factor Analysis  Gaussian Mixture Models  Bayesian Analysis  
视音频全局时序特征在疑似广告检测中的应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2012
作者:  张波
Adobe PDF(7235Kb)  |  收藏  |  浏览/下载:153/0  |  提交时间:2015/09/02
广告检测  广告分割  视频分析  多模态融合  在线学习  Commercial Detection  Commercial Segmentation  Video Analysis  Multi-model Fusion  Online Learning