CASIA OpenIR

浏览/检索结果: 共21条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向低功耗的语音增强与分离算法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  黄雅婷
Adobe PDF(3433Kb)  |  收藏  |  浏览/下载:297/17  |  提交时间:2022/09/14
语音增强与分离  脉冲神经网络  模型压缩  听觉感知恢复  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:301/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
复杂场景图像中的文字检测方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2021
作者:  黄燃东
Adobe PDF(21972Kb)  |  收藏  |  浏览/下载:256/2  |  提交时间:2021/06/08
场景文本检测,注意力机制,训练样本不均衡,并行回归分割,卷积 神经网络  
基于回归方法的单目相机人脸重建研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  王鹏睿
Adobe PDF(7276Kb)  |  收藏  |  浏览/下载:366/9  |  提交时间:2020/09/10
三维人脸重建  弱监督学习  明暗成形  网格形变  单目相机  
复杂场景语音前端增强与分离算法研究 学位论文
工学学位, 北京: 中国科学院自动化研究所, 2020
作者:  李晨星
Adobe PDF(11281Kb)  |  收藏  |  浏览/下载:309/15  |  提交时间:2020/07/20
语音去混响  语音增强  语音分离  远场语音识别  
基于神经网络的机器翻译关键技术研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  张晓伟
Adobe PDF(1768Kb)  |  收藏  |  浏览/下载:288/3  |  提交时间:2018/06/11
神经网络  机器翻译  模型压缩  解码加速  离线翻译  
基于表示学习的中文短文本对话分析方法研究 学位论文
, 北京: 中国科学院大学, 2017
作者:  周玉军
Adobe PDF(2456Kb)  |  收藏  |  浏览/下载:551/8  |  提交时间:2017/12/07
中文短文本对话  深度神经网络  表示学习  词/字向量  注意力机制  
基于深度神经网络的语音识别技术及应用 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2014
作者:  范利春
Adobe PDF(4420Kb)  |  收藏  |  浏览/下载:712/0  |  提交时间:2015/09/02
大词汇量连续语音识别  深度神经网络  鲁棒语音特征  局部连接的深度神经网络  多语言混合识别  关键词检测  Large Vocabulary Continue Speech Recognition (Lvcsr)  Deep Neural Network (Dnn)  Robust Speech Feature  Partially Connected Dnn  Mixed-language Speech Recognition  Spoken Term Detection (Std)  
统计机器翻译中模型的训练、自适应和学习算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2014
作者:  卢世祥
Adobe PDF(2569Kb)  |  收藏  |  浏览/下载:284/0  |  提交时间:2015/09/02
统计机器翻译  大规模语言模型  翻译模型  领域自适应  深度神经网络  Statistical Machine Translation  Large-scale Language Model  Translation Model  Domain Adaptation  Deep Neural Network  
广播视频节目层结构分析及视觉内容检索研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2013
作者:  陈见耸
Adobe PDF(3915Kb)  |  收藏  |  浏览/下载:236/0  |  提交时间:2015/09/02
广播视频  节目层结构分析  音视频模板匹配  重复序列检测  图像检索  台标识别  Broadcast Videos  Program Layer Structure Analysis  Audio/video Template Matching  Repeated Sequence Detection  Image Retrieval  Tv Logo Recognition