第4章 无损数据压缩.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 4 章 无损数据压缩 数据压缩可分成两种类型,一种叫做无损压缩,另一种叫做有损压缩。 无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的 1/2~1/4。一些常用的无损压缩算法有霍夫曼(Huffman)算法和 LZW(Lenpel-Ziv Welch)压缩算法。 有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如,图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。 本章主要介绍目前用得最多和技术最成熟的无损压缩编码技术,包括包含霍夫曼编码、算术编码、RLE 编码和词典编码。对于不打算开发压缩技术和编写压缩程序的读者可不必深究编译码的详细过程。 香农-范诺与霍夫曼编码 香农-范诺编码算法需要用到下面两个基本概念: Entropy(熵)的概念 熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。 某个事件的信息量用 表示 , 其中 为第 个事件的概率, 信源 S 的熵的定义 按照仙农(Shannon)的理论,信源S 的熵定义为 其中 是符号 在 S 中出现的概率; 表示包含在 中的信息量,也就是编码所需要的位数。例如,一幅用 256 级灰度表示的图像,如果每一个象素点灰度的概率均为 ,编码每一个象素点就需要 8 位。 [例 4.1] 有一幅 40 个象素组成的灰度图像,灰度共有 5 级,分别用符号A、B、C、D 和 E 表示,40 个象素中出现灰度A 的象素数有 15 个,出现灰度B 的象素数有 7 个,出现灰度C 的象素数有 7 个等等,如表 4-01 所示。如果用 3 个位表示 5 个等级的灰度值,也就是每个象素用 3 位表示,编码这幅图像总共需要120 位。 表 4-01 符号在图像中出现的数目 符 号 符 号 出现的次数 15 7 7 6 5 按照仙农理论,这幅图像的熵为 H(S) = (15/40) ? (40/15) + (7/40) ? (40/7) + ? ? ? + (5/40) ? (40/5) =2.196 这就是说每个符号用 2.196 位表示,40 个象素需用 87.84 位。 最早阐述和实现这种编码的是Shannon(1948 年)和Fano(1949 年),因此被称为仙农-范诺(Shannon- Fano)算法。这种方法采用从上到下的方法进行编码。首先按照符号出现的频度 或概率排序,例如, , , , 和 ,如表 4-02 所示。然后使用递归方法分成两个 部分,每一部分具有近似相同的次数,如图4-01 所示。按照这种方法进行编码得到的总位数为 91。压缩比约为 1.3 : 1。 符号分配的代码 符号 分配的代码 需要的位数 出现的次数( ) A 15 (0.375) 1.4150 00 30 B 7 (0.175) 2.5145 01 14 C 7 (0.175) 2.5145 10 14 D 6 (0.150) 2.7369 110 18 E 5 (0.125) 3.0000 111 15 图 4-01 香农-范诺算法编码举例 4.1.2 霍夫曼编码 霍夫曼(Huffman)在 1952 年提出了另一种编码方法,即从下到上的编码方法。现仍以一个具体的例子说明它的编码步骤: 初始化,根据符号概率的大小按由大到小顺序对符号进行排序,如表 4-03 和图 4-02 所示。 把概率最小的两个符号组成一个节点,如图4-02 中的D 和E 组成节点 P1。 重复步骤 2,得到节点 P2、P3 和 P4,形成一棵“树”,其中的 P4 称为根节点。 从根节点 P4 开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。 从根节点 P4 开始顺着树枝到每个叶子分别写出每个符号的代码,如表4-03 所示。 按照仙农理论,这幅图像的熵为 H(S) = (15/39) ? = 2.1859 压缩比 1.37:1。 (39/15) + (7/39) ? (39/7) + ? ? ? + (5/39) ? (39/5) 符号 出现的次数 log (1/p 符号 出现的次数 log (1/p )

文档评论(0)

hao187 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档