CASIA OpenIR  > 模式识别国家重点实验室  > 语音交互
音频数据的编码方法及解码方法
陶建华; 刘斌; 潘诗锋
2012-11-27
公开日期2013-04-10
授权国家CN
专利类型发明
摘要本发明提供了一种音频数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过短时能量和短时过零率进行端点检测,剔除原始音频中的非音频数据,获得语音段数据;从语音段数据提取特征参数,通过已训练的隐马尔科夫模型和Viterbi算法,对每帧语音段数据进行状态识别,确定状态序列和状态时长;以及对状态序列和状态时长进行编码,生成音频数据包。本发明可以在低编码速率的情况下,保持较高的语音音质。
专利号CN201210487489.0
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8760
专题模式识别国家重点实验室_语音交互
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
陶建华,刘斌,潘诗锋. 音频数据的编码方法及解码方法. CN201210487489.0[P]. 2012-11-27.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CN201210487489-音频数据的(1260KB)专利 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[陶建华]的文章
[刘斌]的文章
[潘诗锋]的文章
百度学术
百度学术中相似的文章
[陶建华]的文章
[刘斌]的文章
[潘诗锋]的文章
必应学术
必应学术中相似的文章
[陶建华]的文章
[刘斌]的文章
[潘诗锋]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。