小波变换在语音压缩中的应用1.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小波变换在语音压缩中的应用1.doc

小波变换在语音压缩中的应用 摘要 本文介绍了小波变换在语音压缩中两种新技术。第一种技术是消除了低于某一阈值与能量值小波分解高频系数的零小波变换。第二种技术是平均零小波变换,它除了履行第一种技术所要达到的目标之外,它平均分解的小波近似系数。这些系数几乎不变,是较高层次的分解转化。然后,小波系数在传输前,用Lloyd量化的算法和编码和熵编码技术,在接收端,接收信号进行解码,然后才处理减少量化。 1引言 信号压缩在语言交际系统中起着重要的作用。它产生一个紧凑的数据表示,允许有效的存储和资料传送。 在参考【一】中,据报道,语音信号采样量化的8位/样本,在64千位/秒的水平,即在8kHz被压缩到2.4千比特/有足够的清晰度,但缺乏一些自然性。在某些应用中,例如音频会议和互联网,语音压缩质量应该比电话质量更好。 本文中提出了两种新的压缩技术。每一种技术都在后来被证明,不仅产生了一个更高的压缩比,而且实现了在较高信噪比条件段的质量的提高和平均意见得分值测试比率的提高。本文中所讨论的语音压缩技术是基于离散小波传输。提出的这种技术比现有的技术更加简单而有效。 语音信号分为成段长度为20毫秒时域,每个部分转化利用离散小波变换。小波变换系数的能量值低于某一临界值是由零改为水平, 从而定义了一个新的小波变换技术,它被称为零小波变换。利用小波变换在语音信号和分解的策略,得出两种详细而近似的系数。已经注意到,近似系数的小波分解在高水平下几乎不变。因此,只需发送此常数的值再加上信号段时间长度。这建议使用另一种被称为平均零小波变换的技术。小波变换系数进行量化用劳埃德优化的算法,并利用熵编码后的编码方法。 在接收端,信号压缩重建,将在后面介绍。重建信号的压缩比和质量指标方面的评估,是为了将两个新的技术和现有如传统的离散余弦变换和离散小波变换的进行比较。 本文在第二节中简要讨论小波变换和压缩技术。第三节将专门为计算机仿真,它是适用于零小波传输和平均零小波传输的一个阿拉伯文和英文语音数据集。本文报道了一系列主观和客观音质用Matlab和C语言编写的程序进行的结果。第四节包括结论以及后续工作。 2小波变换和压缩技术 2.1 小波变换 小波变换被广泛的应用与多个领域,尤其是在信号的压缩和编码方面。在【4】【5】【6】【7】中引进了许多优秀的小波理论。离散小波变换想法的背后是代表作为一个基础功能上设置一个带权的总和信号即被缩放和时间移动的单个母板的小波x(t。 2.2 压缩技术 最有效的压缩方案涉及改变输入数据,通过投影功能的基础上,再设置它的编码产生的变换系数。最近,使用最广泛的转化一直是块离散余弦变换【6】。因此,离散小波变换在已收到的语音压缩领域的语音质量得到了极大关注。 语音信号可分为表示(如脉冲列车)和清音(如噪音)激发九,其中的语音压缩的根本目的是减少传输的位,同时保持一个可接受的语音质量。这是通过消除言论无声的一部分,被迫零之后,离散小波变换的低能量。 离散变换可以通过一个八度频带滤波器组扩展【6】,其中信号拆分通过两通道滤波器组首先计算。然后,低通再次使用的版本是分裂低通/高通滤波和向下采样等。如果是双通道滤波器组正交,那么它实现了一个离散正交变换。信号的两个较低分辨率版本,一个低通(或粗分辨率)和高通(或罚款分辨率)和本从一个低通输出过程递归应用版本,分裂是称为多分辨率分解。这都说明了多分辨率分解图1,图2与建议的技术的其他区块。 由于准平稳的语音信号,他们及时可以使用分割处理。各段语音数据转化利用离散小波变换。此转换将产生一个数据加上被称为近似和细节尺度的波动系数几个当地平均水平,分别为CA和CD. 这些系数具有高能量低频率,低能量高频率【12】。因此,低频系数和高频部分系数,取决于能源阈的选择,需要重建言语。低于阈值的其他系数将被设置为零,一个特殊的字符将在这些系数传输时负责确定其位置和长度。这种被成为零小波变换的技术将导致一个好的重建语音质量非常低的比特率。因此,有一个良好的特定的语音压缩特性的变换,具有大量的系数为零。此外,在高层次的小波分解中,值得注意的是CA的系数几乎不变。因此,只需要发送一个数据,代表此常数的值,以及这些系数各自的长度。这种压缩技术被称为平均零小波变换。以上所描述的各种小波变换技术都是遵循劳埃德最优量化算法和熵编码【2】和【3】。图1和图2显示的离散小波变换的分解和反离散小波变换的两个步骤与建议技术改造来实现所建议的零小波变换的语音信号压缩方案的重建。在图1,一块电磁意味着在输出小波系数的能量措施。从这个块输出分为两路。一个路径通过一定的阈值水平(BT)以下的系数与能源而另一个路径通过其余的系数。这些系数分别表示为(BT)的SC和CDi,其中SC代表一个特殊字符,我表示分解的水平。如图1所示的,允许使用SC或CDI的系数

文档评论(0)

phljianjian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档