CASIA OpenIR  > 模式识别国家重点实验室  > 机器人视觉
一种发音稳定段辅助的语音识别优化解码方法及装置
刘文举; 杨占磊
2012-12-04
Date Available2013-04-03
CountryCN
Subtype发明
Abstract本发明公开了一种基于发音稳定段的语音识别解码方法。针对语音识别解码过程复杂度较高的问题,本发明提出利用语音的稳定性信息改善解码过程中路径扩展的方式,达到降低解码复杂度的目的。本发明的方案包括下列步骤:对语音信号计算语谱图;计算语音信号的分频带能量及其变化率;定位语音信号中能量发生跳变的时间点;获取语音的发音稳定段;根据解码过程中路径扩展发生的位置,将扩展划分为隐马尔科夫模型之间的扩展,以及隐马尔科夫模型内部各状态间的扩展两类;跟踪语音识别解码过程,定位隐马尔科夫模型之间的扩展;在发音稳定段,删除原解码框架下的隐马尔科夫模型之间的扩展,只允许路径在隐马尔科夫模型内部各状态间进行扩展。
Patent NumberCN201210514763.9
Status授权
Document Type专利
Identifierhttp://ir.ia.ac.cn/handle/173211/8757
Collection模式识别国家重点实验室_机器人视觉
Affiliation中国科学院自动化研究所
Recommended Citation
GB/T 7714
刘文举,杨占磊. 一种发音稳定段辅助的语音识别优化解码方法及装置. CN201210514763.9[P]. 2012-12-04.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[刘文举]'s Articles
[杨占磊]'s Articles
Baidu academic
Similar articles in Baidu academic
[刘文举]'s Articles
[杨占磊]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[刘文举]'s Articles
[杨占磊]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.