第三章 词典编码.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 词典编码

多媒体技术 词典编码 徐家臻 本章内容 词典编码的基本原理 LZ77 LZ78 LZW 基本思想 对于不同长度的符号串都统一用一种记号(token)来表示。 以牛津词典为例子,欲编码“Data Compression” 这两个英文字,查词典后发现 “Data” 出现在第271页的第13个字;“Compression” 出现在第213页的第8个字。 因此,可以用(271,13)(213,8)这两个记号来表示“Data Compression” 。 所用的词典共有1354页,每页最多不超过64个字,因此每一个记号可以用11位来表示页数,6位原来表示第几个字,共17位。 原本若使用8位的ASCII码需要8x16=128个位元,利用这个方法的压缩比为128/34=3.765倍。 词典编码 定长编码 问题:如果要压缩二进制文件,词典哪里来? 词典就是待压缩文件的一部分 Jacob Ziv, Abraham Lempel, Terry Welch LZ77, LZ78, LZW LZ77 LZ77 LZ77编码步骤 在滑动窗口中寻找与从前向缓冲区第一个符号开始的最大匹配串 以三元组(pos, len, ch)作为对最大匹配串的描述 如果匹配成功 pos – 由前向缓冲区第一个符号开始,从后向前(从右向左)数的索引值(从0开始计数) len – 匹配串长度 ch – 匹配串之后的第一个符号(的编码) 窗口向后滑动 匹配串长度 + 1 如果匹配失败 pos – 0, len – 0 ch -前向缓冲区第一个符号(的编码) 窗口向后滑动 1 LZ77编码举例 书 P25 LZ77编码举例 假设符号串为: … | c a b r a c a | d a b r a r | r a r r a d … 假设窗口大小 13, 前向缓冲区大小 6 从前向缓冲区的第一个符号d开始编码, 前3项编码(三元组)是什么? (0, 0, d) (7, 4, r) (3, 5, d) LZ77解码举例 … | c a b r a c a | … (0, 0, d) (7, 4, r) (3, 5, d) (0, 0, d): | c a b r a c a | d c | a b r a c a d | LZ77解码举例 (7, 4, r): | a b r a c a d | | a b r a c a d | | a b r a c a d | a | a b r a c a d | a b | a b r a c a d | a b r | a b r a c a d | a b r a | a b r a c a d | a b r a r a b r a c | a d a b r a r | LZ77解码举例 (3, 5, d): | a d a b r a r | | a d a b r a r | | a d a b r a r | r | a d a b r a r | r a | a d a b r a r | r a r | a d a b r a r | r a r r | a d a b r a r | r a r r a | a d a b r a r | r a r r a d a d a b r a | r r a r r a d | LZ77的一些改进 与Huffman相结合,对三元组进行Huffman编码 (0, 0, x)情况下的三元组很浪费,用1位标志位表示后面的内容是匹配情况还是不匹配情况,可以省掉前两个0占的位数 LZ77编码方法的简单分析 LZ77为什么可以取得较好的压缩效果? 它的假设是什么? 在临近的地方可能出现相似的片段 如果相似片段总是间隔较远怎么办? LZ78编码 用二元组(i, c)编码 i – 词典索引 c – 下一个符号 步骤: 开始时词典为空,i = 1,从待编码读入符号 从词典中寻找最大匹配片段, 如找到,假设对应片段的词典索引为ik,匹配片段为pn,后一个符号cn : 输出(ik, cn) ,将片段pncn加入词典第i项 如未找到,输出(0, cn) ,将片段cn加入词典第i项 i = i + 1,继续向后读入符号。 LZ78举例 w a b b a □ w a b b a □ w a b b a □ w a b b a □ w o o □ w o o □ w o o LZW LZ78的改进 去掉了编码(i, c)中的c LZW编码举例 w a b b a □ w a b b a □ w a b b a □ w a b b a □ w o o □ w o o □ w o o LZW编码举例 w a b b a □ w a b b a □ w

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档