CASIA OpenIR  > 模式识别国家重点实验室  > 机器人视觉
一种发音稳定段辅助的语音识别优化解码方法及装置
刘文举; 杨占磊
2012-12-04
公开日期2013-04-03
授权国家CN
专利类型发明
摘要本发明公开了一种基于发音稳定段的语音识别解码方法。针对语音识别解码过程复杂度较高的问题,本发明提出利用语音的稳定性信息改善解码过程中路径扩展的方式,达到降低解码复杂度的目的。本发明的方案包括下列步骤:对语音信号计算语谱图;计算语音信号的分频带能量及其变化率;定位语音信号中能量发生跳变的时间点;获取语音的发音稳定段;根据解码过程中路径扩展发生的位置,将扩展划分为隐马尔科夫模型之间的扩展,以及隐马尔科夫模型内部各状态间的扩展两类;跟踪语音识别解码过程,定位隐马尔科夫模型之间的扩展;在发音稳定段,删除原解码框架下的隐马尔科夫模型之间的扩展,只允许路径在隐马尔科夫模型内部各状态间进行扩展。
专利号CN201210514763.9
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8757
专题模式识别国家重点实验室_机器人视觉
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
刘文举,杨占磊. 一种发音稳定段辅助的语音识别优化解码方法及装置. CN201210514763.9[P]. 2012-12-04.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[刘文举]的文章
[杨占磊]的文章
百度学术
百度学术中相似的文章
[刘文举]的文章
[杨占磊]的文章
必应学术
必应学术中相似的文章
[刘文举]的文章
[杨占磊]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。