- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Huffman 编码的1.2kb/s 的
MELP 语音编码算法
1 2
董欣 ,李伟
1 大连工业大学信息科学与工程学院,辽宁大连 (116034)
2 韩国东明大学情报通讯学科,韩国釜山 (608-711 )
E-mail:dongxin463@163.com
摘 要:为了适应无线通信等低速语音编码的场合,本论文提出了一种基于Huffman 编码
的1.2kb/s 的MELP 语音编码算法,该算法在解码等方面较传统的2.4kb/sLPC 算法有了较
大的改进。本设计是在2.4kb/sMELP 算法的基础上,使用Huffman 压缩算法对特征参数进
行压缩处理和解压缩处理。实验表明,恢复出来的语音效果和2.4kb/s 的语音效果是几乎没
有分别的。
关键词:MELP;语音压缩编码;混合激励;Huffman
中图分类号: TP311
1. 引言
随着通信、计算机网络等技术的飞速发展,语音压缩编码技术得到了快速发展,尤其
是在移动通信、卫星通信、多媒体技术以及 IP 电话通信中得到普遍应用,起着举足轻重的
作用。极低速率语音传输技术已经越来越受到关注,很多领域对语音的压缩传输率要求很
高,例如:GPRS 无线通讯领域,低速网络多媒体通讯等 [1] 。
低速率数字语音传输具有重大的实用价值,压缩的每一个比特都意味着节省开支,高
质量的极低速率语音编码技术将成为研究的重点。MELP 编码方法它结合混合激励、多带
激励以及原型波形内插等编码方法的优点,采用一种新的更符合人的发音机制的语音生成
模型来合成语音,并利用自适应频谱增强技术,提高合成语音与分析语音的匹配度,实现
了低码率的语音编码。本设计所研究的语音编码算法也是目前在世界上压缩速率极低的一
种语音编码算法,可以为低速率网络传输音频数据节省很多的资源开销,很有研究的意义
[2]
。
2. MELP 混合激励线性预测编码
就目前具有通信质量的中、低码率语音编码器而言,16kb/s 和 8kb/s 的技术已经标准
化和产品化,4~8kb/s 是标准化制定和使用产品竞争的热点,主流仍为 CELP 类型的技术,
而重要的研究焦点,将逐步转向更低的码率,譬如 2.4kb/s 或 1.2kb/s 编码器。近年来,国
内外在开展4kb/s 及其一下速率的语音编码研究方面,主要代表算法有四个[1] :
多带激励编码(MBE——Multiband Excitation Coding );
正弦变换编码(STC——Sinusoidal Transform Coding);
混合激励线性预测(MELP——Mixed-Excitation Linear Prediction )编码;
波形内插(WI——Waveform Interpolation )编码;
其中,MBE 和 STC 为基于正弦合成分析模型(SASM——Sinusoidal Analysis/Synthesis
Models )的语音编码算法,MELP 为基于二元激励模型的线性预测编码算法,WI 为基于
SASM 和线性预测模型的混合型编码算法。
MELP 算法把语音分为清音、浊音和抖动浊音三种状态。抖动浊音采用非周期脉冲加
白噪声作为合成激励信号,浊音采用周期脉冲加白噪声作为合成激励信号。
-1-
采用这种新的分类模式,对语音的分类更加精细。更为重要的是,它从方法上解决了
二元模型对大量“ 中间”语音不能正确分类的难题,诸如过渡音或较弱浊音等语音的分类;
因为那些具有比较强的非周期性的语音(清音)和比较强的浊音是比较容易判别出来的。
其他语音采用混合激励后,无论是把它判作浊音还是抖动浊音,都能够通过混合比例的调
整给予较好的近似[1] 。
因而,可以较好地改善合成语音地自然度。同时,也可以减少激励信号中脉冲成分或
噪声成分过多所带来地合成噪声
文档评论(0)