基于正交变换的无损音频压缩.docVIP

下载本文档

4
0
约6.91千字
约 11页
2018-07-13 发布于江西
举报
版权申诉

基于正交变换的无损音频压缩.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于正交变换的无损音频压缩.doc

基于正交变换的无损音频压缩文章编号:1002-8684(2005)O5l—o4基于正交变换的无损音频压缩朱敏,胡剑凌,徐盛(上海交通大学图像通信与信息处理研究所,上海20o03O)⑥6@@@@响响⑥0⑥U语音技术n?论文?【摘要】介绍了基于正交变换的无损音频编码的技术框架,并对其关键技术即分帧,整数变换和熵编码作了深入的分析,最后将其在性能上与其它预测方案进行比较,结果表明其在压缩比上存在优势.【关键词】无损音频压缩;整数变换;整数改进离散余弦变换;熵编码【中图分类号】TN912【文献标识码】ALosslessAutoCompressionbasedonOrthogonalTransformZHUMin,HUJian-ling.XUSheng(InstituteofImageCommunicationandInformationProcessing,ShanghaiJiaotongUniversity,Shanghai200030,China)【Abstract】Inthispaper,wholecodingschemeoflosslessaudiocompressionbasedonorthogonaltransformispre—sented,andthekeytechnologiessuchasframing,integertransformandentropycodingareintroducedindetail.Experimentalresultsshowthatthetransformbasedschemeprovideslowerbitratesthanthoseoflinearpredictionbasedschemes.【Keywords】losslessaudiocompression;integertransform;IntMDCT;entropycoding1引言无损音频压缩是指在不损失任何音频信息的前提下实现压缩.目前的有损编码标准(如MP3和AC一3)在大多数情况下能够达到良好的主观音质和高压缩比,但遇到数据动态范围较大的音乐(如交响乐等)时,其音质就差强人意了.在一些演播室或者音乐厅环境中,有损编码后的音频效果无法达到期望的逼真度.另外,在音频编辑的过程中常需要对音频数据作二次编码(即从一种有损格式转换成另一种有损格式,或者格式不变仅改变比特率),如VCD音频压缩格式为MPEG2,需转化为MPEG3格式用于因特网上传输.不同压缩格式的码流之间无法直接转化,只能先对MPEG2解码为PCM格式,然后对PCM进行MPEG3编码.由于有损编码丢失了一部分的音频数据,有损压缩格式的二次编码将丢失更多的信息,从而引入更大的失真.与有损压缩相比,无损压缩后能达到真正透明音质,且在不同的无损格式之间相互转化不丢失任何音频信息,唯一的不足是目前压缩比仍不够高.但随着大容量的存储设备的研制和高速宽带网的建设,将大大推动无损音频压缩的广泛应用.数字音频的无损编码中,如果直接使用熵编码方法进行压缩(如LempeLZiv编码,Huffman编码或算术编码),其结果并不令人满意,原因在于熵编码只利用了数据的统计冗余进行压缩,而没有考虑音频信号的相关性.同时考虑上述两方面的信号特征能更有效地实现压缩.为消除数据的相关性,通常有2种方法,即预测和正交变换.笔者在此重点介绍基于正交变换的无损音频压缩方案.2基于正交变换的无损压缩方案目前,无损压缩的方案有2类:可分级编码(含无损编码模块)和独立的无损编码[51.可分级编码的系统如图1所示.它基于有损编码算法发展而成,包括有损编码模块和一个无损增强层.码字C是输入信号X经正交变换,量化后的结果.为达到无损压缩,编码器进行本地解码并产生重建信号Y,与输入信号X相减后得差值e,再对e进行无损编码.有损压缩编码c和误差e的无损编码c均需传输.在解码器端,有损解码的重建值加上通过对c无损解码得到的误差信号e,最终获得对输人信号的完美重建.无损变换音频压缩(LosslessTransforlnAudioCom一!苎查QQ曼:国口nn语音技术⑥6@@@@响响⑥0⑥pression,LTAC)算法[63为该方案的代表.上述方案中,可以近似认为有损部分表示原始信号的轮廓,而无损部分表示信号的细节.因而它特别适合于网络实时应用.当带宽比较宽裕时,可以传输完整的高质量音频;而在带宽受限时便只传输轮廓,这样在声音质量和网络带宽之间获得良好的折衷.随着整数一整数变换的出现[21,独立的无损编码方案也随之发展起来,其结构如图2所示.解码器的操作相反.由于在整数变换的过程中,使得信号的能量分布更为集中,为熵编码提供了有利条件,因而可实现较为有效的压缩.2种方案相比,独立的无损编码更容易实现.下面着重分析无损编