已选(0)清除
条数/页: 排序方式: |
| 会议场景智能语音处理技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 范志赟![](/image/person.jpg)
Adobe PDF(3323Kb)  |   收藏  |  浏览/下载:279/12  |  提交时间:2022/09/15 会议场景,语音识别,说话人转换点检测,说话人自适应 |
| 复杂场景语音前端增强与分离算法研究 学位论文 工学学位, 北京: 中国科学院自动化研究所, 2020 作者: 李晨星![](/image/person.jpg)
Adobe PDF(11281Kb)  |   收藏  |  浏览/下载:369/17  |  提交时间:2020/07/20 语音去混响 语音增强 语音分离 远场语音识别 |
| 自然场景文本检测与识别技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 盛芬芬![](/image/person.jpg)
Adobe PDF(14633Kb)  |   收藏  |  浏览/下载:525/21  |  提交时间:2020/06/12 自然场景图像 文本检测 文本识别 端到端提取 深度学习 |
| 基于循环神经网络的声学建模方法研究 学位论文 , 北京: 中国科学院大学, 2018 作者: 赵媛媛![](/image/person.jpg)
Adobe PDF(4227Kb)  |   收藏  |  浏览/下载:416/11  |  提交时间:2018/06/13 声学建模 循环神经网络 多维残差学习 词打散 改进的低帧率模型 多场景中文语音识别 |
| 基于表示学习的中文短文本对话分析方法研究 学位论文 , 北京: 中国科学院大学, 2017 作者: 周玉军![](/image/person.jpg)
Adobe PDF(2456Kb)  |   收藏  |  浏览/下载:561/8  |  提交时间:2017/12/07 中文短文本对话 深度神经网络 表示学习 词/字向量 注意力机制 |
| 智能交互型虚拟角色运动合成方法研究 学位论文 , 北京: 中国科学院研究生院, 2017 作者: 王雨萌![](/image/person.jpg)
Adobe PDF(22448Kb)  |   收藏  |  浏览/下载:295/4  |  提交时间:2017/06/06 角色动画 运动合成 交互式动画 递归神经网络 深度强化学习 |
| 口语语音交互关键问题研究 学位论文 , 北京: 中国科学院研究生院, 2016 作者: 陈萧![](/image/person.jpg)
Adobe PDF(1546Kb)  |   收藏  |  浏览/下载:267/3  |  提交时间:2016/06/30 语音交互 语音识别 文本语气识别 语音语气识别 语音活动检测 增长式语音识别 基频提取 |
| 多语言及语种无关的关键词语音搜索研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2012 作者: 马泽君
Adobe PDF(2724Kb)  |   收藏  |  浏览/下载:527/0  |  提交时间:2015/09/02 语音关键词搜索 多语言统一声学建模 语种无关语音搜索 声学模型无监督训练 置信度融合 Spoken Term Detection(Std) Multilingual Acoustic Modeling Language-independent Std Unsupervised Acoustic Model Training Confidence Combination |
| 英语口语超音段层次自动检错与评估技术的研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2011 作者: 黄申
Adobe PDF(3989Kb)  |   收藏  |  浏览/下载:215/1  |  提交时间:2015/09/02 语音识别 计算机辅助语言学习 超音段 流利 韵律 Speech Recognition Computer Aided Language Learning Supra-segmental Feature Fluency Prosody |
| 基于计算听觉场景分析的单声道混合语音分离研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2007 作者: 李鹏![](/image/person.jpg)
Adobe PDF(1867Kb)  |   收藏  |  浏览/下载:308/0  |  提交时间:2015/09/02 单声道语音分离 计算听觉场景分析 二值掩蔽 语音客观质量评估 多基音跟踪 因子最大矢量量化 Monaural Speech Separation Computational Auditory Scene Analysis Binary Mask Objective Quality Assessment Of Speech Multi-pitch Tracking Factorial-max Vector Quantization |