第3章 无失真信源编码.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * 无失真 * * * * * * * 例题4 3. 对每三个信源(三维扩展)符号进行编码。 例题4 3. 对每三个信源(三维扩展)符号进行编码。 §3.5 实用的无失真信源编码方法 游程编码 算术编码 LZW编码 3.5.1 游程编码 游程编码主要用于黑白二值文件、传真的数据压缩。 由于传真文件中连“0”和连“1”较多.这些连“0”或连“1”的字符串称为游程.对游程长度进行霍夫曼编码或其他的编码处理就可以达到压缩数据的目的。 下图是一幅10×50黑白二值图像。  游程编码 BBBBBBBBBBXXXXXXXXXAAAAAAUUUUUUUUUUUUU 符号码 标识码 游程长度 编码: B#10X#9A#6U#13 对于黑、白二值文件: 1、黑白游程总是交替出现,可以规定第一游程为白游程。 2、不同游程长度出现的概率不同,对游程长度进行编码采用霍夫曼编码,概率大的编长码,概率小的编短码。 游程编码 MH编码 Modified Huffman的简称,即改进的霍夫曼编码,适用于传真等黑白位图图像的压缩,其基本的编码规范为: (1) 游程长度在0~63时,直接查表用相应的结尾码作为码字; (2) 游程长度在64~1728范围内时,用组合码加上结尾码作为相应的码字; (3) 每行的第一个游程规定为白游程(长度可以为零),每行用一个结束码(EOL) 终止; (4) 在传输时,每页数据之前加一个结束码,每页尾部连续使用6个结束码。 73白游程=64+9 :1101110100 00110101010110101011110110000110011000000000001 0白1黑15白4黑77白5黑 压缩比=1728/47=36.7:1 结尾码 组合基干码 A、 K星人与大不列颠百科全书 时间:xx年xx月xx日 地点:英国大不列颠博物馆 人物:来自K星的王富贵 事件:王富贵试图带走百科全书,但是飞船空间受限,如何将信息全部带走? 工具:无限精度的尺,飞船。 1 Hello World-从小例子谈起 元芳,你怎么看? 3.5.2 算术编码 算术式编码是一种非分组码,无需计算出所有N长信源序列的概率分布及码表,可以直接对输入的信源符号序列编码输出。这种方法是由香农-费诺-埃利斯编码直接扩展得到的。 算术式编码算法的中心思想是高效地计算n长信源符号序列x的分布概率p(x)和累积概率F(x),然后用区间[F(x)-p(x), F(x)]中的一个值来作为x的码字。 算术编码 静态的算术编码 自适应的算术编码 某条信息中可能出现的字符仅有 a b c 三种,我们要压缩保存的信息为 bccb。 在没有开始压缩进程之前,假设我们对 a b c 三者在信息中的出现概率一无所知,我们暂时认为三者的出现概率相等,也就是都为 1/3。 我们拿到第一个字符 b,这时三个字符的概率分布变成:1/4,2/4,1/4。 接着我们拿到字符 c,新添了 c 以后,三个字符的概率分布变成 1/5,2/5,2/5。 现在输入下一个字符 c,三个字符的概率分布为:1/6, 2/6,3/6。 输入最后一个字符 b,上一步中得到的 b 的区间为 0.6390 - 0.6501。 在这个区间内随便选择一个容易变成二进制的数,例如 0.64,将它变成二进制 0.1010001111。 输出为1010001111, 3.5.3 LZ码 LZ是J.Ziv和A.Lempel两个发明者姓氏的缩写。此二人于1977年发表题为《顺序数据压缩的一个通用算法》的论文,论文中描述的算法被后人称为LZ77算法。 1978年,二人又发表了该论文的续篇,描述了后来被命名为LZ78的压缩算法。 在1984年,Terry?Welch发表论文描述了他在Sperry研究中心的研究成果,也就是后来非常有名的LZW算法。 Phillip W.Katz(菲利普·卡兹) ——PKZIP(DEFLATE) Winzip 共享软件—WinRAR LZ77 字典编码 BUPT Press 3.5.3 LZW码 LZW码也称基于字典的编码方法,它是定长码。 基于字典编码的基本原理 计算机文件是以字节为单位组成的。LZW码是一种自适应变码,它的字典是直接由被压缩文件在编码过程中生成的。 字典的构成 字典的容量为4096(0~4095),序号用12bit表示.最后一个单词(第4095个单词)为空。 输入符号序列:ABCABDABCAAAABBBABCABCA 前缀 后缀 序号 0X000 0X041 0X0FF 0

文档评论(0)

339910001 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档