基于Huffman编码1.2kbsMELP语音编码算法.pdfVIP

下载本文档

6
0
约 7页
2017-09-01 发布于安徽
举报
版权申诉

基于Huffman编码1.2kbsMELP语音编码算法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Huffman 编码的1.2kb/s 的 MELP 语音编码算法 1 2 董欣，李伟 1 大连工业大学信息科学与工程学院，辽宁大连 (116034) 2 韩国东明大学情报通讯学科，韩国釜山 (608-711 ） E-mail：dongxin463@163.com 摘要：为了适应无线通信等低速语音编码的场合，本论文提出了一种基于Huffman 编码的1.2kb/s 的MELP 语音编码算法，该算法在解码等方面较传统的2.4kb/sLPC 算法有了较大的改进。本设计是在2.4kb/sMELP 算法的基础上，使用Huffman 压缩算法对特征参数进行压缩处理和解压缩处理。实验表明，恢复出来的语音效果和2.4kb/s 的语音效果是几乎没有分别的。关键词：MELP；语音压缩编码；混合激励；Huffman 中图分类号: TP311 1. 引言随着通信、计算机网络等技术的飞速发展，语音压缩编码技术得到了快速发展，尤其是在移动通信、卫星通信、多媒体技术以及 IP 电话通信中得到普遍应用，起着举足轻重的作用。极低速率语音传输技术已经越来越受到关注，很多领域对语音的压缩传输率要求很高，例如：GPRS 无线通讯领域，低速网络多媒体通讯等 [1] 。低速率数字语音传输具有重大的实用价值，压缩的每一个比特都意味着节省开支，高质量的极低速率语音编码技术将成为研究的重点。MELP 编码方法它结合混合激励、多带激励以及原型波形内插等编码方法的优点，采用一种新的更符合人的发音机制的语音生成模型来合成语音，并利用自适应频谱增强技术，提高合成语音与分析语音的匹配度，实现了低码率的语音编码。本设计所研究的语音编码算法也是目前在世界上压缩速率极低的一种语音编码算法，可以为低速率网络传输音频数据节省很多的资源开销，很有研究的意义 [2] 。 2. MELP 混合激励线性预测编码就目前具有通信质量的中、低码率语音编码器而言，16kb/s 和 8kb/s 的技术已经标准化和产品化，4～8kb/s 是标准化制定和使用产品竞争的热点，主流仍为 CELP 类型的技术，而重要的研究焦点，将逐步转向更低的码率，譬如 2.4kb/s 或 1.2kb/s 编码器。近年来，国内外在开展4kb/s 及其一下速率的语音编码研究方面，主要代表算法有四个[1] ：多带激励编码（MBE——Multiband Excitation Coding ）; 正弦变换编码（STC——Sinusoidal Transform Coding）; 混合激励线性预测（MELP——Mixed-Excitation Linear Prediction ）编码; 波形内插（WI——Waveform Interpolation ）编码; 其中，MBE 和 STC 为基于正弦合成分析模型（SASM——Sinusoidal Analysis/Synthesis Models ）的语音编码算法，MELP 为基于二元激励模型的线性预测编码算法，WI 为基于 SASM 和线性预测模型的混合型编码算法。 MELP 算法把语音分为清音、浊音和抖动浊音三种状态。抖动浊音采用非周期脉冲加白噪声作为合成激励信号，浊音采用周期脉冲加白噪声作为合成激励信号。 -1- 采用这种新的分类模式，对语音的分类更加精细。更为重要的是，它从方法上解决了二元模型对大量“ 中间”语音不能正确分类的难题，诸如过渡音或较弱浊音等语音的分类；因为那些具有比较强的非周期性的语音（清音）和比较强的浊音是比较容易判别出来的。其他语音采用混合激励后，无论是把它判作浊音还是抖动浊音，都能够通过混合比例的调整给予较好的近似[1] 。因而，可以较好地改善合成语音地自然度。同时，也可以减少激励信号中脉冲成分或噪声成分过多所带来地合成噪声