- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业设计(论文)开题报告
课题名称 LZ78字典编码码的特性分析
副 标 题
系(院)名称: 电子与信息工程系
专 业: 电子信息工程
姓 名: 张 如 霞
学 号: 1114036
二○一四 年 四 月 一 日
毕业设计(论文)课题背景(含文献综述)
数据压缩技术比较系统的研究,开始于在40年代初形成的信息论。早期科学家研究的是在已知消息中各种符号出现的频率时,要想办法构造出一种编码技术,使得消息的所占空间尽可能的减少。尽管当时计算机尚未出现,但是那时进行的研究与如今计算机中所使用的压缩技术有很大的联系。数据压缩的研究过程一直都有两个重要的方向,一是建立信源和数据压缩的数学模型,二是工程技术人员所进行的工作,建立能实现数据压缩功能的系统。
当数据压缩使得存储空间减少的时候,程序的执行时间就相应的减少。因为存储量的减少导致磁盘存取次数的减少,尽管数据压缩/解压缩会增加额外的程序指令,但是这花费的时间远远少于数据存取的时间,总体来说,执行时间将减少。所以,数据压缩技术在计算机技术飞速发展的今天,依旧有着十分重要的作用。
以Huffman编码为代表的压缩模型都是基于对信息单个字符出现频率的统计而设计的,直到70年代末期,这种思想在数据压缩领域一直占据着统治地位。但是,往往一项技术在某一领域形成了惯例,人们就很难创造出在思想上与其大相径庭的哪怕是更简单更实用的技术来。直到1977年,Jacob Ziv和Abraham Lempel发表了论文《顺序数据压缩的一个通用算法》。1978年,他们又发表了该论文的续篇《通过可变比率编码的独立序列的压缩》。这两篇论文提出的两个压缩技术被称为LZ77和LZ78算法。Lz77算法使用固定大小窗口进行术语匹配,而不是在所有已经编码的信息中匹配。而lz78算法放弃了文本窗口的概念,采用树形结构构造字典和保存短语,从而确保文件中的内容均能反映到字典中。它们的思路和字典颇为相似,因此,人们将基于这一思路的编码方法称作字典式编码。字典式编码不但在压缩效果上大大超过了哈夫曼编码,而且,对于好的实现,它的压缩和解压缩的速度也是异常的惊人。
LZ78算法设置的字典开始是空的,它的大小受限于可用的存储空间。编码器输出双字段的标识,第一个字段是指向字典的指针,第二个字段是字符的编码。标识中不含匹配串长度,因为隐含在字典中,每一个标识对应一个输入字符串,当标识被写进压缩流中后, 该字符串就被添加到字典中。字典在位置0以空串开始,随着字符的输入和编码,字符串被添加到字典上的位置1,2……上,当从输入流中读入下一个字符X时,就在字典中搜索X这个单字符串词条,如果没有找到,就把X加进字典的下一个可用位置,并输出表示“X”的标识(0,X)。如果找到了带有X的词条(比如在位置1上),则当读入下一个字符Y时,就在字典中搜索含有双字符串XY的词条。如果没找到,就把串xy添加到字典的下一个可用位置上,并输出标识(1,y)表示串xy,因为串子字典中的位置为1,。如此继续直到输入完毕。这就是lz78算法工艺流程。
Lz78最大的优点是在每个编码步骤中减少了缀-符串(String)比较的数目,而压缩率与LZ77类似。但是基于编码之前,lz78算法的设置并没有单独字符的字典编码,需要在读入一个字符的同时,将其编入自己的字典,如果下一次读入在已有的字典中没有找到该字符,就再编入新的字典中。如此循环。在理论上,lz78的重要性是当输入数据由一静态无噪信源产生时,随着数据大小的增加,压缩趋于最优化。以信源的熵值来编码无限长的串。但是lz78事实上收敛得相当慢,这种优化实际上要等到数据文件趋于无限长时才能真正的实现。 1984年,T.Welch给出了LZ78算法的实用变型LZW。它的压缩速度比LZSS快的多。理论再次证明,当输入数据文件由以稳定的各态经历的码源产生时,LZW算法的压缩效果随着输入文件的增长而渐渐地趋近于最佳压缩。这是一个好的发现,是压缩编码技术得到进一步的提升。如果只是在原先的技术上操作,在时间和空间上也许满足不了我们对信息搜寻的要求。自从出现了这几种编码,我们看到了一路以来,技术的变化和发展,也能感受到对于压缩信息,我们从繁化简的技术风格也日新月异。一切为了快速浏览信息和掌握信息。在编码技术的不断成熟和创新之下,有了当下更加实用化的信息资源。
二、毕业设计(论文)方案介绍(主要内容)
学习掌握字典编码的内容和流程方法
您可能关注的文档
- 《毕业论文-通用汽车公司战略管理分析》.doc
- 《毕业论文-邮储银行内部审计存在的问题》.doc
- 《毕业论文-遗传算法的函数优化问题研究》.docx
- 《毕业论文-酒店管理系统》.doc
- 《毕业论文-重庆市物业管理企业文化建设现状与问题分析》.doc
- 《毕业论文-逆向工程在曲面零件设计与检测的应用研究》.doc
- 《毕业论文-遗传算法在函数优化中的应用》.doc
- 《毕业论文-酒店无线覆盖管理系统的设计》.doc
- 《毕业论文-金属硫化物的脱毛效应和温泉、花岗岩放射性探究》.doc
- 《毕业论文-金融危机背景下我国外贸遭遇的困境及对策研究》.doc
- 《毕业论文开题报告_肺畅益生;—贝母甘草食品的开发研制》.doc
- 《毕业论文开题报告_肺畅益生—贝母甘草食品的开发研制》.doc
- 《毕业论文开题报告__化学故事在中学化学教学中的融入研究》.doc
- 《毕业论文开题报告—构建多主体农村公共产品供给机制》.doc
- 《毕业论文开题报告基于稀疏表示的单帧图像超分辨重建算法研究》.doc
- 《毕业论文开题报告书_晋宁东大河湿地公园生态旅游资源开发研究》.doc
- 《毕业论文开题报告电网塔材原材料和组焊件》.doc
- 《毕业论文开题报告提纲》.doc
- 《毕业论文开题报告礼物在人际传播中的作用分析及其广告推广建议》.doc
- 《毕业论文开题报告论秘书的参谋职能与实施策略》.doc
文档评论(0)