CASIA OpenIR

浏览/检索结果: 共26条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:241/11  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:301/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
面向鸡尾酒会问题的视觉辅助语音分离算法研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  张鹏
Adobe PDF(8406Kb)  |  收藏  |  浏览/下载:291/4  |  提交时间:2021/06/21
鸡尾酒会问题  语音分离  视觉辅助  在线流式处理  生成对抗训练  
面向低资源场景的端到端语音识别方法研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  易澄
Adobe PDF(3846Kb)  |  收藏  |  浏览/下载:323/13  |  提交时间:2021/06/21
低资源语音识别  端到端  预训练  
基于回归方法的单目相机人脸重建研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  王鹏睿
Adobe PDF(7276Kb)  |  收藏  |  浏览/下载:366/9  |  提交时间:2020/09/10
三维人脸重建  弱监督学习  明暗成形  网格形变  单目相机  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  盛芬芬
Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:477/21  |  提交时间:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
复杂场景语音前端增强与分离算法研究 学位论文
工学学位, 北京: 中国科学院自动化研究所, 2020
作者:  李晨星
Adobe PDF(11281Kb)  |  收藏  |  浏览/下载:309/15  |  提交时间:2020/07/20
语音去混响  语音增强  语音分离  远场语音识别  
基于循环神经网络的声学建模方法研究 学位论文
, 北京: 中国科学院大学, 2018
作者:  赵媛媛
Adobe PDF(4227Kb)  |  收藏  |  浏览/下载:381/11  |  提交时间:2018/06/13
声学建模  循环神经网络  多维残差学习  词打散  改进的低帧率模型  多场景中文语音识别  
基于深度神经网络的语音识别技术及应用 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2014
作者:  范利春
Adobe PDF(4420Kb)  |  收藏  |  浏览/下载:713/0  |  提交时间:2015/09/02
大词汇量连续语音识别  深度神经网络  鲁棒语音特征  局部连接的深度神经网络  多语言混合识别  关键词检测  Large Vocabulary Continue Speech Recognition (Lvcsr)  Deep Neural Network (Dnn)  Robust Speech Feature  Partially Connected Dnn  Mixed-language Speech Recognition  Spoken Term Detection (Std)  
电视节目结构化分析与摘要技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  徐夙
Adobe PDF(13971Kb)  |  收藏  |  浏览/下载:143/0  |  提交时间:2015/09/02
逻辑单元分割  条件随机场模型  图片摘要  图片摘要可视化  Logical Unit Segmentation  Conditional Random Field  Still-image Abstract  Still-image Visualization