- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业论文开题报告_LZ78字典编码码的特性分析
毕业设计(论文)开题报告
课题名称 LZ78字典编码码分析Lz77算法使用固定大小窗口进行术语匹配,而不是在所有已经编码的信息中匹配。而lz78算法放弃了文本窗口的概念,采用树形结构构造字典和保存短语,从而确保文件中的内容均能反映到字典中。它们的思路和字典颇为相似,因此,人们将基于这一思路的编码方法称作字典式编码。字典式编码不但在压缩效果上大大超过了哈夫曼编码,而且,对于好的实现,它的压缩和解压缩的速度也是异常的惊人。
LZ78算法设置的字典开始是空的,它的大小受限于可用的存储空间。编码器输出双字段的标识,第一个字段是指向字典的指针,第二个字段是字符的编码。标识中不含匹配串长度,因为隐含在字典中,每一个标识对应一个输入字符串,当标识被写进压缩流中后, 该字符串就被添加到字典中。字典在位置0以空串开始,随着字符的输入和编码,字符串被添加到字典上的位置1,2……上,当从输入流中读入下一个字符X时,就在字典中搜索X这个单字符串词条,如果没有找到,就把X加进字典的下一个可用位置,并输出表示“X”的标识(0,X)。如果找到了带有X的词条(比如在位置1上),则当读入下一个字符Y时,就在字典中搜索含有双字符串XY的词条。如果没找到,就把串xy添加到字典的下一个可用位置上,并输出标识(1,y)表示串xy,因为串子字典中的位置为1,。如此继续直到输入完毕。这就是lz78算法工艺流程。
Lz78最大的优点是在每个编码步骤中减少了缀-符串(String)比较的数目,而压缩率与LZ77类似。Lz78对lz77的某些方面做出了改进,其字典可以很大,是依赖于整个被编码的上下文的,字典和匹配长度都无须传递,由解码器自动同步建立和维护。它发生匹配时,不是保存一个三元组,而是一个二元组:匹配位置和不匹配的第一个字符。同时,还要将这个字符串保存到内存中,为此,它需要一个不断增长的编码字串表。
利用案例加深体验字典编码形成的实用意义。研究lz78算法的优缺点,分析其生成的意义。在了解了lz78编码的基础上,利用Matlab对LZ78编码进行仿真Manning C D. Foundations of statistical natural language processing [M]. MIT press, 1999.
Manning C D, Raghavan P, Schütze H. Introduction to information retrieval[M]. Cambridge: Cambridge university press, 2008.
Martin J H, Jurafsky D. Speech and language processing[J]. International Edition, 2000.
赵晓群. 现代编码理论[M]. 华中科技大学出版社, 2008.
何丹,李志蜀,一种基于LZSS的文本文件压缩算法[J].计算机应用, 2008.
宗成庆. 统计自然语言处理[M]. 清华大学出版社, 2008.
刘彦明,荣政编.计算机软件技术技术[M].人民邮电出版社.2005.
闾松林.基于字典的编解码算法研究与应用[J],2012.
袁玫,袁文编著.数据压缩技术及其应用[M]. 电子工业出版社, 1995 Ziv J, Lempel A. A universal algorithm for sequential data compression[J]. IEEE Transactions on information theory, 1977, 23(3): 337-343.
Terry A Welch.A Technique for High-performance data compression.IEEE Computer,1984,8(20):564-572.
Rabiner L. A tutorial on hidden Markov models and selected applications in speech recognition[J]. Proceedings of the IEEE, 1989, 77(2): 257-286.
C. E. Shannon.??A mathematical theory of communication[J]. ACM SIGMOBILE Mobile Computing and Communications Review . 2001 (1)
李从鹤,郑辉.一种用于文本压缩的信源容错译码算法[J].信息传输与接入技术,2006,32(2):36-38.
王忠义,姜丹.关于Lempel-Ziv77压缩算法及实现的研究[J].计
您可能关注的文档
- 段坤高速铁路线路工劳动安全.doc
- 母_乳_喂_养_技_巧.ppt
- 母亲焦虑与幼儿人格发展的关系研究学位论文开题报告.doc
- 母家沟水库初设水文评审后.doc
- 母家沟水库安全评价(水文).doc
- 母猪管理.ppt
- 母语对英语学习的影响及对策毕业论文.doc
- 每小时50吨一体化污水处理设备设计方案.doc
- 母婴传播与疫苗.ppt
- 比亚迪秦双模混合动力汽车的整车故障检测与诊断辅助软件设计开题报告.doc
- (4篇)XX区抓党建促基层治理培训心得体会汇编12.docx
- 汇编1154期-在培训班上的讲话汇编(3篇).doc
- 汇编1173期-专题党课讲稿汇编(3篇)112.doc
- 汇编1076期-主题党课讲稿汇编(3篇).doc
- 汇编1177期-学习心得体会汇编(3篇)112.doc
- (6篇)党和国家机构改革心得体会汇编.docx
- 汇编1166期-坚定理想信念、全面从严治党、担当作为专题党课讲稿汇编(3篇)112.doc
- 汇编1174期-专题党课讲稿汇编(3篇)112.doc
- 教育13期-主题教育学习心得体会、研讨发言材料参考汇编(3篇).doc
- 汇编1458期-心得体会研讨发言提纲参考汇编(3篇)123.doc
文档评论(0)