到底那种压缩软件与压缩算法好.docVIP

下载本文档

4
0
约1.21万字
约 10页
2018-06-14 发布于福建
举报
版权申诉

到底那种压缩软件与压缩算法好.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

到底那种压缩软件与压缩算法好

到底那种压缩软件和压缩算法好前言--王者归来? 等待足足两年之久，压缩霸主WinZip终于在万众期待下发布了9.0正式版。全世界自然一片沸腾，在世界各大知名下载网站中，WinZip9.0再次带起下载狂潮。然而此时国内并没有王者回归的欢呼，却一致委婉或直接地表达出失望地情绪，而下载更新的用户也寥寥无几，这绝对是一道国内独特的风景，它不禁让人想问，为什么?从各种评测报告看，因为不支持RAR格式，所以兼容性更佳的WinRAR3.30全面超越固步自封的WinZip9.0--原来这就是国内用户抵触WinZip9.0的唯一理由。苍天已死，黄天当立。这是国内舆论草率的结论。之所以说草率，是因为甚至都没有出现反面声音的媒体，这绝对不是一个成熟正常的氛围。正是这种一边倒的跟风导致了大量用户极端的心态，于是牵强附会、人云亦云和以讹传讹的声音充斥其间。这不由得让人陷入深思，事实上，看似压缩工具之争的表面下深藏的是压缩格式之争。RAR格式即将或者己经取代了ZIP格式吗?不能仅仅从两者的技术表现和统计数据去回答这个问题，计算机数据压缩格式的发展历程是非常独特的，它的王者之选带有传奇的历史烙印，并一直持续产生着决定性的影响。要正确解答这个问题就必须去了解有关数据压缩的历史，任何试图避开历史环境而做出的结论都是轻率的。因此请不妨先认识数据压缩的历史本来，再来决定这些压缩工具的前程是非。 LZ算法--ZIP与RAR共祖同源要讲压缩的历史，就不可不提LZ算法，这是一种有关数据压缩的算法，何为数据压缩?从本质上讲，数据压缩的目的就是要消除信息中的冗余。早在LZ算法出现之前，研究员们从理论上探讨了压缩算法的数学基础及模型基础，同时也在这些基础上研究出了一些编码方法，其中的Shannon-Fano编码和Huffman编码非常有影响力。但这些编码，包括后来发展出的算术编码，都无法成为理想的编码方法--因为它们无法在编码效率和编码速度上同时满足日益增长的压缩需求。这种情况在LZ算法出现时等到了解决。 Shannon编码 1948年贝尔实验室的Shannon发表的论文《通信的数学理论》中指出，任何信息都存在冗余，冗余大小与信息中每个符号的出现概率或者说不确定性有关。Shannon借鉴了热力学的概念，把信息中排除了冗余后的平均信息量成为信息熵，并给出了计算信息熵的数学表达式。这篇伟大的论文后来被誉为信息论的开山之作，信息熵同时也奠定了所有数据压缩算法的理论基础。利用信息熵公式，人们可以计算出信息编码的极限。不过完备的理论并不等于实用的技术，要将理论变为实践，编码方法是极为重要的一步。1948年，Shannon在提出信息熵理论的同时，事实上也给出了一种简单的编码方法--Shannon编码。1952年，麻省理工学院的R.M.Fano又进一步提出了Fano编码。两者后来被称为Shannon-Fano编码，这种早期的编码方法揭示了变长的编码方法揭示了变长编码的基本规律，也也确实可以取得一定的压缩效果，但离真正实用的压缩算法还相去甚远。 Huffman编码 Huffman编码是第一个真正实用的编码方法，由D.A.Huffman在1952年提出。当时Huffman是麻省理工学院的一名学生，据说为了向老师证明自己可以不参加某门功课的期末考试，他设计了这个看似简单却影响深远的编码方法。Huffman编码效率高，运算速度快，实现方式灵活，从20世纪60年代直到现在，在数据压缩领域得到了广泛的应用。而20世纪80年代初，Huffman编码又出现在CP/M和DOS系统中，即使在今天，在许多知名的压缩工具和压缩算法里(如WinZip、gzip和JPEG)，也都有Huffman编码的身影。不过，Huffman编码所得的编码长度只是对信息熵计算结果的一种近似，并不能真正逼近信息熵的极限。Huffman编码影响力很深远，至今还在计算机大专学生必修课程《数据结构》中被提及。 LZ是其发明者J.Ziv和A.Lempel两个犹太人姓氏的缩写。此二人于1977年发表题为《顺序数据压缩的一个通用算法》的论文，论文中描述的算法被后人称为LZ77算法。1978年，二人又发表了该论文的续篇，描述了后来被命名为LZ78的压缩算法。其实LZ系列的算法并不新鲜，其中既没有高深的理论背景，也没有复杂的数学公式。它们只是简单的延续了千百年来人们对字典的追崇和喜好，并用一种极为巧妙的方式将字典技术运用于通用数据压缩领域。简单的说如果你习惯用字典中的页码和行号代替文章中的每个单词的时候，那实际上你已经掌握了LZ系列算法的真谛，因此这类编码算法被统称为Dictionary coders。在1984年，Terry Welch发表论文描述了他在Sperry研究中心(现在Unisys公司的一部分)的研究成果，也就是后来非常有名的LZ