CASIA OpenIR

浏览/检索结果: 共45条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
会议场景智能语音处理技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  范志赟
Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:279/12  |  提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应  
感知线索辅助的语音分离技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  郝云喆
Adobe PDF(5007Kb)  |  收藏  |  浏览/下载:342/16  |  提交时间:2022/06/23
鸡尾酒会问题  语音分离  声纹线索  起止线索  多感知线索  
面向鸡尾酒会问题的视觉辅助语音分离算法研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:  张鹏
Adobe PDF(8406Kb)  |  收藏  |  浏览/下载:331/4  |  提交时间:2021/06/21
鸡尾酒会问题  语音分离  视觉辅助  在线流式处理  生成对抗训练  
复杂场景图像中的文字检测方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2021
作者:  黄燃东
Adobe PDF(21972Kb)  |  收藏  |  浏览/下载:304/2  |  提交时间:2021/06/08
场景文本检测,注意力机制,训练样本不均衡,并行回归分割,卷积 神经网络  
基于回归方法的单目相机人脸重建研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  王鹏睿
Adobe PDF(7276Kb)  |  收藏  |  浏览/下载:438/9  |  提交时间:2020/09/10
三维人脸重建  弱监督学习  明暗成形  网格形变  单目相机  
基于编解码框架的端到端语音识别技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  董林昊
Adobe PDF(5860Kb)  |  收藏  |  浏览/下载:413/27  |  提交时间:2020/06/13
语音识别技术  神经网络  编解码框架  端到端建模  
自然场景文本检测与识别技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  盛芬芬
Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:525/21  |  提交时间:2020/06/12
自然场景图像  文本检测  文本识别  端到端提取  深度学习  
基于神经网络的机器翻译关键技术研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  张晓伟
Adobe PDF(1768Kb)  |  收藏  |  浏览/下载:309/3  |  提交时间:2018/06/11
神经网络  机器翻译  模型压缩  解码加速  离线翻译  
面向机器翻译的语言预处理与性能优化 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  汪春奇
Adobe PDF(2217Kb)  |  收藏  |  浏览/下载:224/4  |  提交时间:2018/06/08
机器翻译  序列标注  中文分词  半监督学习  半自回归  
语音合成声学建模技术研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  王文富
Adobe PDF(4177Kb)  |  收藏  |  浏览/下载:440/8  |  提交时间:2018/06/07
语音合成  声学建模  门控循环混合密度网络  卷积输出层  对抗学习  端到端