CASIA OpenIR

浏览/检索结果: 共10条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:258/12  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:323/18  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:315/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
基于回归方法的单目相机人脸重建研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  王鹏睿
Adobe PDF(7276Kb)  |  收藏  |  浏览/下载:386/9  |  提交时间:2020/09/10
三维人脸重建  弱监督学习  明暗成形  网格形变  单目相机  
复杂场景语音前端增强与分离算法研究 学位论文
工学学位, 北京: 中国科学院自动化研究所, 2020
作者:  李晨星
Adobe PDF(11281Kb)  |  收藏  |  浏览/下载:333/16  |  提交时间:2020/07/20
语音去混响  语音增强  语音分离  远场语音识别  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  盛芬芬
Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:497/21  |  提交时间:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
基于多信息融合的端到端语音合成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  邹雨巷
Adobe PDF(1954Kb)  |  收藏  |  浏览/下载:303/11  |  提交时间:2020/06/10
语音合成  多信息融合  端到端  
语音合成声学建模技术研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  王文富
Adobe PDF(4177Kb)  |  收藏  |  浏览/下载:421/8  |  提交时间:2018/06/07
语音合成  声学建模  门控循环混合密度网络  卷积输出层  对抗学习  端到端  
基于深度神经网络的字幕行识别方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  翟传磊
Adobe PDF(6784Kb)  |  收藏  |  浏览/下载:286/2  |  提交时间:2017/06/22
深度神经网络  图像文本行识别  链接时序分类  注意力机制  
电话信道下说话人分离及识别研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  张策
Adobe PDF(1685Kb)  |  收藏  |  浏览/下载:386/0  |  提交时间:2015/09/02
说话人识别  说话人分离  因子分析  高斯混合模型  贝叶斯分析  Speaker Recognition  Speaker Diarization  Factor Analysis  Gaussian Mixture Models  Bayesian Analysis