第三章词典编码.pptVIP

下载本文档

15
0
约4.35千字
约 31页
2017-05-28 发布于河南
举报
版权申诉

第三章词典编码.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章词典编码

多媒体技术词典编码徐家臻本章内容词典编码的基本原理 LZ77 LZ78 LZW 基本思想对于不同长度的符号串都统一用一种记号(token)来表示。以牛津词典为例子，欲编码“Data Compression” 这两个英文字，查词典后发现 “Data” 出现在第271页的第13个字；“Compression” 出现在第213页的第8个字。因此，可以用(271,13)(213,8)这两个记号来表示“Data Compression” 。所用的词典共有1354页，每页最多不超过64个字，因此每一个记号可以用11位来表示页数，6位原来表示第几个字，共17位。原本若使用8位的ASCII码需要8x16=128个位元，利用这个方法的压缩比为128/34=3.765倍。词典编码定长编码问题：如果要压缩二进制文件，词典哪里来？词典就是待压缩文件的一部分 Jacob Ziv, Abraham Lempel, Terry Welch LZ77, LZ78, LZW LZ77 LZ77 LZ77编码步骤在滑动窗口中寻找与从前向缓冲区第一个符号开始的最大匹配串以三元组(pos, len, ch)作为对最大匹配串的描述如果匹配成功 pos – 由前向缓冲区第一个符号开始，从后向前(从右向左)数的索引值(从0开始计数) len – 匹配串长度 ch – 匹配串之后的第一个符号(的编码) 窗口向后滑动匹配串长度 + 1 如果匹配失败 pos – 0, len – 0 ch -前向缓冲区第一个符号(的编码) 窗口向后滑动 1 LZ77编码举例书 P25 LZ77编码举例假设符号串为： … | c a b r a c a | d a b r a r | r a r r a d … 假设窗口大小 13，前向缓冲区大小 6 从前向缓冲区的第一个符号d开始编码，前3项编码(三元组)是什么？ (0, 0, d) (7, 4, r) (3, 5, d) LZ77解码举例 … | c a b r a c a | … (0, 0, d) (7, 4, r) (3, 5, d) (0, 0, d): | c a b r a c a | d c | a b r a c a d | LZ77解码举例 (7, 4, r): | a b r a c a d | | a b r a c a d | | a b r a c a d | a | a b r a c a d | a b | a b r a c a d | a b r | a b r a c a d | a b r a | a b r a c a d | a b r a r a b r a c | a d a b r a r | LZ77解码举例 (3, 5, d): | a d a b r a r | | a d a b r a r | | a d a b r a r | r | a d a b r a r | r a | a d a b r a r | r a r | a d a b r a r | r a r r | a d a b r a r | r a r r a | a d a b r a r | r a r r a d a d a b r a | r r a r r a d | LZ77的一些改进与Huffman相结合，对三元组进行Huffman编码 (0, 0, x)情况下的三元组很浪费，用1位标志位表示后面的内容是匹配情况还是不匹配情况，可以省掉前两个0占的位数 LZ77编码方法的简单分析 LZ77为什么可以取得较好的压缩效果？它的假设是什么？在临近的地方可能出现相似的片段如果相似片段总是间隔较远怎么办？ LZ78编码用二元组(i, c)编码 i – 词典索引 c – 下一个符号步骤：开始时词典为空，i = 1，从待编码读入符号从词典中寻找最大匹配片段，如找到，假设对应片段的词典索引为ik，匹配片段为pn，后一个符号cn ：输出(ik, cn) ，将片段pncn加入词典第i项如未找到，输出(0, cn) ，将片段cn加入词典第i项 i = i + 1，继续向后读入符号。 LZ78举例 w a b b a □ w a b b a □ w a b b a □ w a b b a □ w o o □ w o o □ w o o LZW LZ78的改进去掉了编码(i, c)中的c LZW编码举例 w a b b a □ w a b b a □ w a b b a □ w a b b a □ w o o □ w o o □ w o o LZW编码举例 w a b b a □ w a b b a □ w

您可能关注的文档

文档评论（0）

f8r9t5c + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：8000054077000003

1亿VIP精品文档

更多 >

第三章词典编码.pptVIP