多媒体数据压缩.docVIP

下载本文档

14
0
约3.8万字
约 42页
2017-03-27 发布于贵州
举报
版权申诉

多媒体数据压缩.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多媒体数据压缩多媒体数据压缩

多媒体数据压缩进入信息时代，人们越来越依靠计算机来获取和利用信息，而数字化后的视频和音频等媒体信息具有海量性，与当前计算机所提供的存储资源和网络带宽之间有很大差距，这给存储多媒体信息带来很大困难，成为阻碍人们获取有效信息的瓶颈。因此，有必要以压缩的形式存储和传播多媒体信息，同时因为多媒体数据之间存在大量冗余现象，如空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余和纹理统计冗余，使多媒体数据压缩成为可能。针对多媒体数据冗余类型的不同，相应地有不同的压缩方法。根据解码后数据与原始数据是否完全一致进行分类，压缩方法可被分为有失真编码和无失真编码两大类，其中有失真编码也称有损压缩（Loss Compression），无失真编码也称为无损压缩（Lossless Compression）。无损压缩算法无损压缩指数据经过压缩后，信息不受损失，还能完全恢复到压缩前的原样而不引起任何失真。它和有损压缩相对，这种压缩通常压缩比小于有损压缩的压缩比。由于压缩率是受到数据统计冗余度的理论限制，所以一般为2：1到5：1。这类方法广泛用于文本数据，程序和特殊应用场合的图像数据（如指纹图像，医学图像等）的压缩。由于压缩比的限制，仅使用无损压缩方法是不可能解决图像和声音的存储和传输的所有问题。经常使用的无损压缩方法有熵编码、游长编码、香农-凡诺编码、霍夫曼编码，词典编码和算术编码等。信息熵编码数据压缩技术的理论基础就是信息论。根据信息论的原理，可以找到最佳数据压缩编码的方法，数据压缩的理论极限是信息熵。如果要求编码过程中不丢失信息量，即要求保存信息熵，这种信息保持编码叫熵编码，是根据消息出现概率的分布特性而进行的，是无损压缩编码。信息量的大小和消息有一定的关系。在数学上，消息是其出现概率的单调下降函数。信息量越大，消息的可能性越少，反之亦然。信息量是指：为了从N个相等的可能事件中挑选出一个事件所需要的信息度量和含量，所提问“是或否”的次数。也就是说，在N个事件中辨识特定的一个事件要询问“是与否”次数。例如：要从256个数中选定某一个数，可以先提问“是否大于128？”，不论回答是与否，则半数的可能事件被取消。如果继续询问下去，每次询问将对应一个1bit的信息量。随着每次询问，都将有半数的可能事件被取消，这个过程由以下公式表示：log2256 = 8bit。由上可知，对于256个数的询问只要进行8次，即可确定一个具体的数。如果将信息源所有可能事件的信息量进行平均，即可得到信息的“熵”（entropy）。一个具有符号集S={s1，s2，…，sn}的信息源的熵η定义为公式：η=，其中pi是S中符号Si出现的概率。例如：有一幅40个像素组成的灰度图像，灰度共有5级，分别用符号A，B，C，D和E表示，40个像素中出现灰度A的像素数有15个，出现灰度B的像素有7个，出现灰度C的像素数有7个，出现灰度D的像素数有6个，出现灰度E的像素数有5个。如果用3个位表示5个等级的灰度值，也就是每个像素用3位表示，编码这幅图像总共需要120位。而如果用熵的方法来计算：η=（15/40）×log2（40/15）+（7/40）×log2（40/7）+…+（5/40）×log2（40/5）= 2.196。这就是说每个符号用2.196位表示，40个像素需要用87.84位。一般而言，如果概率分布比较平稳则熵较大，如果分布有尖峰，则熵较小。香农-凡诺算法是由贝尔实验室的shannon和MIT的Robert Fano独立开发的。这种发放采用从上到下的方法进行编码。其编码步骤如下：根据每个符号出现的频率对符号进行排序。递归地将这些符号分成两部分，每一部分中的符号具有相近的频率，直到所有的部分都只含有一个符号为止。实现上述过程的一种很自然的方法就是建立一颗二叉树（binary tree）。按照惯例，我们给二叉树中的左支赋予0，给所有的右分支赋予1。则对应的符号编码为A：00，B：01，C：10，D：110，E：111。图5-1 香农-凡诺算法合并过程霍夫曼编码霍夫曼编码（Huffman Coding）是一种编码方式，是一种用于无损压缩的熵编码（权编码）算法。1952年，David A. Huffman在麻省理工攻读博士时所发明的，并发表于《一种构建极小多余编码的方法》（A Method for the Construction of Minimum-Redundancy Codes）一文。在电脑资料处理中，霍夫曼编码使用变长编码表对源符号（如文件中的一个字母）进行编码，其中变长编码表是通过一种评估来源符号出现机率的方法得到的，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码，这便使编码之后的字符串的平均长度、期望值降低，从而