LZ77压缩算法的实现.docVIP

下载本文档

17
0
约1.12万字
约 18页
2019-06-18 发布于浙江
举报
版权申诉

LZ77压缩算法的实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

LZ77压缩算法的实现专业：班级：学号：姓名：报告日期： PAGE 2 PAGE 2 LZ77压缩算法的实现学生姓名：指导老师：摘要文本压缩是根据一定方法对大量数据进行编码处理以达到信息压缩存储过程，被压缩的数据应该能够通过解码恢复到压缩以前的原状态，而不会发生信息丢失现象。发展到现在已经有很多关于文本压缩的算法，主要有LZ编码、Huffman 编码、算术编码等无损压缩和预测编码、量化、变换编码等有损压缩。本文将讨论LZ77算法实现过程，以及LZ77算法的优劣性和改进方法。关键词多媒体技术；文本压缩算法；LZ77算法；C++程序设计；数据结构；字符串查找；文本匹配； PAGE PAGE 1 目录 TOC \o 1-3 \h \u 1365 1 引言 3 25713 1.1课程设计目的 3 15479 1.2课程设计内容 3 24134 2 算法基本原理 4 7521 2.1算法概述 4 19433 2.2 LZ77压缩 4 22357 2.3 LZ77解压缩 5 13916 3 LZZ算法实现 6 27328 3.1三元组的设计 6 13278 3.2查找匹配串 6 21905 4 实验结果和结果分析 8 10622 4.1 实验结果 8 12825 4.2 实验结果分析 9 15573 5 结束语 10 23016 参考文献 11 2572 附录1：LZ77主要代码清单 12 1 引言随着计算机技术的快速发展,各种系统数据量越来越大,给信息存储特别是网络传输带来诸多的困难,己成为有效获取和使用信息的瓶颈。为了节省信息的存储空间和提高信息的传输效率,必须对大量的实际数据进行压缩。实践证明,采用数据压缩技术可以节省80%以上的费用,且一些难点问题通过压缩技术能够实现。数据压缩技术种类繁多、应用广泛,技术不断发展,一些分支已成为当今研究的焦点。按照编码的失真程度数据压缩可以分为有损压缩和无损压缩。有损压缩即原始数据不能完全恢复,主要应用于图像和数字化的语音方面。无损压缩就是经过一个压缩后,能够产生和输入完全一致的压缩技术,主要用于存储数据库记录或处理文本文件。其中，LZ77算法是无损压缩中常用到的算法。 1.1课程设计目的研究多媒体数据压缩技术是实现实时有效地处理、传输和存储庞大的多媒体数据的关键技术。许多应用领域对多媒体信息的实时压缩提出了更高的要求，快速、高效的压缩算法是解决这一问题的关键。针对多媒体数据在空间、时间、结构、视觉、知识等方面所产生的冗余,利用有损压缩和无损压缩等方法,对图像、音频、视频等多媒体数据进行压缩,以保留尽可能少的有用信息。本文主要是把所学的数据结构和算法设计的知识应用于实践，对LZ77压缩算法加以研究。通过课程设计，可以更好地掌握和理解文本压缩算法，学习常用的压缩算法，并通过比较压缩算法，来加深对多媒体技术的理解。 1.2课程设计内容本次课程设计为LZ77算法的实现，通过用C++语言来这个算法，然后用随机生成的数据来分别对程序进行压缩和解压，检验压缩结果是否正确和测试程序压缩的效率。 2 算法基本原理 2.1算法概述这一算法是由Jacob Ziv 和 Abraham Lempel 于 1977 年提出，所以命名为 LZ77。传统的算法，如Huffman 算法都是建立在静态的字典模型上，但是静态字典模型并不是好的选择。首先，静态模型的适应性不强，我们必须为每类不同的信息建立不同的字典；其次，对静态模型，我们必须维护信息量并不算小的字典，这一额外的信息量影响了最终的压缩效果。LZ77采用了自适应的字典模型，也就是说，将已经编码过的信息作为字典，如果要编码的字符串曾经出现过，就输出该字符串的出现位置及长度，否则输出新的字符串。如下图2.1所示。图 2.1 LZ77算法举例 2.2 LZ77压缩 LZ77算法使用滑动窗口的方法，来寻找文件中的相同部分，也就是匹配串。这里说的串，是指一个任意字节的序列，而不仅仅是可以在文本文件中显示出来的那些字节的序列。这里的串强调的是它在文件中的位置，它的长度随着匹配的情况而变化。 LZ77从文件的开始处开始，一个字节一个字节的向后进行处理。一个固定大小的窗口（在当前处理字节之前，并且紧挨着当前处理字节），随着处理的字节不断的向后滑动。对于文件中的每个字节，用当前处理字节开始的串，和窗口中的每个串进行匹配，寻找最长的匹配串。窗口中的每个串指，窗口中每个字节开始的串。如果当前处理字节开始的串在窗口中有匹配串，就用(之间