CASIA OpenIR  > 模式识别国家重点实验室  > 语音交互
一种语音数据的编码及解码方法
陶建华; 刘斌; 莫福源
2013-05-14
公开日期2013-08-14
授权国家CN
专利类型发明
摘要本发明提供了一种语音数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过端点检测剔除原始音频中的非语音数据,获得语音段数据;对每帧语音数据提取谱参数、基音周期等参数,并计算连续多帧语音数据的增益均值,通过矢量码本对谱参数进行矢量量化,对基音周期和增益均值进行非线性量化;对量化后的各种语音参数进行编码,生成语音数据包。该解码方法包括:对接收到的语音数据包进行解码,提取谱参数、基音周期、增益均值等参数,通过上述参数对激励参数和能量变化轨迹进行预测,最后通过声码器合成语音。本发明可以在极低编码速率的情况下,保持较高的语音音质。
专利号CN201310176701.6
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8781
专题模式识别国家重点实验室_语音交互
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
陶建华,刘斌,莫福源. 一种语音数据的编码及解码方法. CN201310176701.6[P]. 2013-05-14.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CN201310176701-一种语音数(1646KB)专利 开放获取CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[陶建华]的文章
[刘斌]的文章
[莫福源]的文章
百度学术
百度学术中相似的文章
[陶建华]的文章
[刘斌]的文章
[莫福源]的文章
必应学术
必应学术中相似的文章
[陶建华]的文章
[刘斌]的文章
[莫福源]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。