基于动态分块自适应切窗算法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于动态分块自适应切窗算法

基于动态分块自适应切窗算法【摘要】窗口切换算法是一种常用的解决预回声方法。如何有效地判断信号中是否存在瞬变信号以及如何合理地进行长短窗口的切换是判断窗口切换算法优劣的关键。本文充分利用时域掩蔽效应,采用动态分块、自适应切窗思想提出了基于动态分块的自适应切窗算法,避免了短窗的过多切换,减小了算法延时。 【关键词】掩蔽效应;心理声学;预回声;动态分块;窗口切换 1.引言 基于心理声学模型的感知音频编码算法是目前数字音频技术的主要研究方向,其主要思想是利用信号的感知不相干性和统计冗余进行有损压缩,达到在无明显听觉失真的前提下使用于表达信号的比特率最小化。在感知音频编码中,预回声失真是一个比较严重的问题。 预回声是在处理瞬态信号时,其分辨率不足造成的量化噪声在时域扩展的结果。自适应切窗算法是一种有效的处理预回声问题技术。本文基于时域峰值变化率的窗口切换算法,采用心理声学模型中时域掩蔽技术对采样帧动态分块,以减小算法延时。 2.预回声产生机理及抑制技术 2.1 心理声学中的掩蔽效应 人耳对声音的感知存在一种特性,即人类只会对在一定频率范围内具有一定振幅大小的音频信号产生反应并且频率和振幅之间还存在一定的关联性。这就引出了一个重要概念:掩蔽效应。心理声学研究将掩蔽效应分为两种频域掩蔽和时域掩蔽[1]。当掩蔽音和被掩蔽音同时进入听觉系统时发生的掩蔽称为频域掩蔽或称作同时掩蔽(图1);时域掩蔽指的是掩蔽音超前于被掩蔽音或落后于被掩蔽音,前者称为后向掩蔽,后者称为前向掩蔽(图2)。 2.2 预回声产生机理 预回声的本质是时域分辨率不足造成的量化噪声在时域扩展的结果。当输入信号中存在一个瞬变信号或者类似的时域冲击响应时会使得量化编码后的量化噪声较大并且量化噪声在信号重建时会在时域进行扩展如图3(b)。 控制预回声的有效方法就是把整个数据块分成2个小块,并分别做MDCT变换[6],这样量化噪音就会被限制在1块数据中如图3(c)所示。MPEG就是运用长短块切换来控制预回声效应,对于变化剧烈的信号使用短块,而变化缓慢的使用长块。一般短块的长度为8 ms左右,而前掩蔽效应时间为20 ms,因而短块产生的预回音很容易被掩蔽。 3.基于动态分块的自适应切窗算法 3.1 基于时域的窗口切换算法 目前,一种普遍用于解决预回声问题的方法是进行窗口切换,即采用不同的帧长度来进行编码,当音频信号平稳不存在瞬变信号分量的时候采用较长的帧来进行编码;反之则采用短的数据帧来进行编码。窗口切换算法实现好坏的关键就在于如何有效地判断信号中是否存在瞬变信号以及如何合理地进行长短窗口的切换[4]。 为了解决以上问题一种简单且高效的方法就是将窗口切换的判断提前到时域中进行。付轩等人提出了一种基于时域分块峰值变化率来实现瞬变信号检测和窗口切换判断的算法[5]。 但该算法存在两个问题: (1)该算法只是固定的将数据帧分成8个子块没有很好的考虑信号本身的特性和包含信息的差别造成处理中时域分辨率差别较大。比如:对采样率分别为8kHz和44kHz的信号采用相同的量化比特大小以及码率进行编码,由于从AAC每帧采样点均为1024,因此采样率为8kHz的信号每帧对应的时间长度是128ms而采样率为44kHz的信号每帧对应的时间长度约为23ms,如果同样分成8个子块则8kHz的信号每个子块对应的时间为16ms而44kHz的信号约为2.8ms,很明显这两种采样率下的子块对应的时域分辨率存在很大的差别。 (2)由于该算法将瞬变信号分量的判断和窗口切换的判定放在一个阶段完成,也就是说一旦算法确定信号中存在瞬变信号分量就立即进行短窗的切换,没有充分利用时域掩蔽效应进行进一步的分析从而有可能导致过度的短窗切换。 3.2 基于动态分块的自适应切窗算法 3.2.1 数据帧的动态分块 AAC标准数据帧分为1024个采样点,提供8kHz到96kHz的不同采样率。如根据原有的算法将数据块的划分固定为8块,那么其时域分辨率从16ms到1.3ms,时域分辨率差别很大。根据心理声学模型中的时域掩蔽效应(图2),我们可知时域掩蔽的前掩蔽时间为5ms到20ms。 由以上两点本文提出一种采用时域掩蔽效应的动态分块方法。该方法将时域掩蔽效应的有效前掩蔽时间设定阈值P(根据实验结果P的选值为8ms效果较好),将子块长度设定为阈值P(刚好是一个前掩蔽的有效时间)。 采用公式1:分块个数=AAC每帧采样点/(采样率*设定阈值);对数据帧的动态分块。 BlockSize=Int[FrameLenght/(SamplingRate*P) ]公式1 在完成数据帧的动态分块后,还要对字块进行合并以消除边界效

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档