- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
增强的MPEG 4低延时 MPEG 4 AAC LD 编码器
本文主要介绍目前常用的低延时的编码器,比较了各种语言和音频编码器(如AAC-LD,AAC-LC,G.711,G.721,G.722)的编码器算法延时,然后介绍了AAC-LD编码器算法框架和具体的为了减少算法延时采取的编码算法,以及HEAAC编码算法中的SBR技术,即频谱复制和扩展的算法,接下来则介绍了ELD编码器中针对减少算法延时而采取的对参考窗和SBR技术子带的改进,最后部分是改进的低延时ELD编码算法性能的比较,从音频编码质量MUSHRA分,系统延时方面做了对比。
WHYMPEG-4LD
像MP3和AAC这样的感知音频编解码器,可以在较低的比特率下提供很高质量的主观音质。但是这样的编解码器在低比特率下的算法延时往往超过100ms,如下图(从Fraunhofer官方网站)所示,因而并不适合实时的双向通信。而基于G.722的语音编解码方案因为其较小的算法延时而适合于双向通信[1]。但是这种基于语音的编解码方案只能针对语音信号提供较好的主观质量,并不适合更为复杂的音频信号,而且即使在很高的比特率下,该编解码方案给出的结果也很难达到感知的透明的音质[1]。
图1.各种编解码器的算法延迟
延时计算和减少延时的考虑
常用的感知音频编码器的延时包括[3]:
?Framingdelay:进行块变换需要的块长;
?Filterbankdelay:分析-综合滤波器所需要的延时;
?Look-aheaddelayforblockswitching:块切换为检测瞬态而需要的延时;
?Useofbitreservoir:比特池大小相对于平均比特率所需要的延时。
总延时计算公式:
如下面的AAC的解码器为例:
所以为了减少延时,需要减少的包括帧长、前向的预测长度以及比特池。下面首先介绍一下必要的技术基础,即MPEG-4AAC-LD以及SBR技术。
MPEG-4AAC-LD
下面的是AAC-LD的编解码框图,为了减少延时,LD采用了减少帧长到原来的一般,消除了块切换多需要的前向预测同时把比特池也去掉了。这样,在48kHz采样下,可以达到最大的算法延时为20ms。
图2.低延时下的编码器框图[3]:
图3.低延时下的解码器框图[3]:
在AACLD中,为了减少延时,将原来的1024/960的帧长改为512/480;没有了窗切换功能,减少了为进行窗切换所需要的前瞻延时[3];同时为了增强对瞬态信号的编码质量,引入了窗型切换机制,窗型包括一般的SINE窗和一个少重叠的窗,该窗与后面的窗有很少的重叠,这样通过对TNS工具的优化来消除瞬态信号产生的预回声效应。下面是窗函数定义:
其中N=1024or960。
图4.低重叠窗函数
MPEG-4LowDelayAudioCoder(AACLD)是直接源于MPEG-2AAC,并且结合了感知音频编码和双向通信必须的低延时要求。它可以保证最大的20ms的算法延时和包括语音和音乐的信号的很好的音质。现在的MPEG-4LD支持最大采样率48kHz,最大声道数目是2[2],但是可以扩展为多声道。
图5.AAC-LD和MP3的音质比较
至于音质,MPEG-4AACLD可以提供和MP3、AAC相当的音质。低比特流下,32kbps下的AACLD相当于24kpbs下的AAC,并且64kbps下的AACLD优于相同比特率下的MP3,如图所示。同样,相同比特率下,其音质远远高于ITU-TG.711和G.722。
MPEGERAACLD在每声道64kps或者48kbps下可以获得较好的音质。
SpectralBandReplicationSBR是种波形和参数相结合的编码方法,其理论基础是音频信号低频和高频部分之间具有很大的相关性。对原来低频部分的编码仍然采用AAC等方法进行,高频部分则用低频部分来有效地重构。这样就无需直接传输高频部分,只需在AAC编码后的比特流中加入少量的SBR控制信息来保证高频部分的重构,从而在解码端能很好地恢复出完整的音频信号。
音频信号的低频部分仍采用MP3或AAC等核心编码器进行波形压缩编码。高频部分则利用由编码端所传送的相当少的参数来进行重建。这个过程主要是通过复制低频信号和调整复制后的高频频谱来实现的,如图1和图2所示。由于核心编码器不需要对高频信号进行编码,因此更能提高低频信号的压缩音频品质。但SBR技术是以音频信号的低频和高频之间有很强的相关性为前提的。所以,一旦低频和高频信号之间没有相关性时,SBR就会能失效甚至破坏品质。
图6.SBR编码器
输入信号首先被送到降采样器,降采样器为核心编码器(即传统的音频编码器)提供一个频率为输入信号的采样频率的一半的时域信号。同时输入信号又并行的送到QMF(正交镜像滤波器)分析滤波器组。从滤波器组输出的是复数
您可能关注的文档
最近下载
- 自考试卷:行政组织理论自考试题及答案_11.doc VIP
- 静脉治疗护理技术操作标准2023版.pptx VIP
- 《小建筑师》优教课件.ppt VIP
- 活动二 把阳光”弹”来”弹”(课件)蒙沪版二年级上册综合实践活动.pptx VIP
- 广东粤人开心版五年级上册英语 U6 Reading and writing & Chant activities课件.pptx VIP
- 五年级上册《道德与法治》第三单元校本作业.doc VIP
- 五年级上册《道德与法治》第二单元校本作业.doc VIP
- 国内外钻井软件调研.ppt VIP
- 广东粤人开心版五年级上册英语 U5 Practices & Activity & Sounds and words课件.pptx VIP
- 年产 48000 吨新能源导电材料配套尾气综合利用项目环评报告表.pdf VIP
文档评论(0)