- 26
- 0
- 约1.41万字
- 约 17页
- 2016-11-26 发布于重庆
- 举报
第4章无损数据压缩
第4章 无损数据压缩
数据压缩可分成两种类型,一种叫做无损压缩,另一种叫做有损压缩。
无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/2~1/4。一些常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv Welch)压缩算法。
有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如,图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。
本章主要介绍目前用得最多和技术最成熟的无损压缩编码技术,包括包含霍夫曼编码、算术编码、RLE编码和词典编码。对于不打算开发压缩技术和编写压缩程序的读者可不必深究编译码的详细过程。
4.1 香农-范诺与霍夫曼编码
香农-范诺编码算法需要用到下面两个基本概念:
1. Entropy(熵)的概念
熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。
某个事件的信息量用表示 , 其中为第个事件的概率,
2. 信源S的熵的定义
按照仙农(Shannon)的理论,信源S的熵定义为其中是符号在S中出现的概率;表示包含在中的信息量,也就是编码所需要的位数。例如,一幅用256级灰度表示的图像,如果每一个象素点灰度的概率均为,编码每一个象素点就需要8位。
[例4.1] 有一幅40个象素组成的灰度图像,灰度共有5级,分别用符号A、B、C、D和E表示,40个象素中出现灰度A的象素数有15个,出现灰度B的象素数有7个,出现灰度C的象素数有7个等等,如表4-01所示。如果用3个位表示5个等级的灰度值,也就是每个象素用3位表示,编码这幅图像总共需要120位。
表4-01 符号在图像中出现的数目
符 号 出现的次数 15 7 7 6 5 按照仙农理论,这幅图像的熵为H(S) = (15/40) ? (40/15) + (7/40) ? (40/7) + ? ? ? + (5/40) ? (40/5) =2.196这就是说每个符号用2.196位表示,40个象素需用87.84位。
最早阐述和实现这种编码的是Shannon(1948年)和Fano(1949年),因此被称为仙农-范诺(Shannon- Fano)算法。这种方法采用从上到下的方法进行编码。首先按照符号出现的频度或概率排序,例如,,,,和,如表4-02所示。然后使用递归方法分成两个部分,每一部分具有近似相同的次数,如图4-01所示。按照这种方法进行编码得到的总位数为91。压缩比约为1.3 : 1。
表4-02 Shannon-Fano算法举例表
符号 出现的次数() 分配的代码 需要的位数 A 15 (0.375) 1.4150 00 30 B 7 (0.175) 2.5145 01 14 C 7 (0.175) 2.5145 10 14 D 6 (0.150) 2.7369 110 18 E 5 (0.125) 3.0000 111 15
图4-01 香农-范诺算法编码举例
4.1.2 霍夫曼编码
霍夫曼(Huffman)在1952年提出了另一种编码方法,即从下到上的编码方法。现仍以一个具体的例子说明它的编码步骤:
初始化,根据符号概率的大小按由大到小顺序对符号进行排序,如表4-03和图4-02所示。
把概率最小的两个符号组成一个节点,如图4-02中的D和E组成节点P1。
重复步骤2,得到节点P2、P3和P4,形成一棵“树”,其中的P4称为根节点。
从根节点P4开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。
从根节点P4开始顺着树枝到每个叶子分别写出每个符号的代码,如表4-03所示。
按照仙农理论,这幅图像的熵为
H(S) = (15/39) ? (39/15) + (7/39) ? (39/7) + ? ? ? + (5/39) ? (39/5) = 2.1859压缩比1.37:1。
表4-03 霍夫曼编码举例
符号 出现的次数 log2(1/pi) 分配的代码 需要的位数 A 15(0.3846) 1.38 0 15 B 7(0.1795) 2.48 1
您可能关注的文档
- 矿山运输与提升设备试题A及参考答案(山东科技大学).doc
- 矿山测量技能试题.doc
- 研究生考试政治核心要点【2011版】.doc
- 硬盘录像机死机原因分析处理.doc
- 社会心理学教学辅导三.doc
- 福州自考心理学心理实验设计复习串讲资料3.doc
- 福建广播市场数据分析报告.doc
- 离散数学2013数理逻辑测验答案2.doc
- 离散数学全校公选课第2次作业小结111023.doc
- 科博安全隔离与信息交换系统.doc
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 2025年德州市中考数学试题卷(含答案及解析).docx
- ISO 15614-1-2012 金属材料焊接工艺规范和评定.pdf VIP
- 发那科fanuc维修手册 内部资料教材.pdf VIP
- 2026年节后复工开工第一课课件.ppt
- 蔬菜水果的收货验货标准.doc VIP
- 新部编人教版语文五年级上册生字字帖直接打印资料文档.pdf VIP
- 东北大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- T_DZJN 455-2025 冶金工业变频节能选型设计规范.docx VIP
- 北京邮电大学《机器学习》2024 - 2025 学年第一学期期末试卷.pdf VIP
- 新版2026春重庆大学版英语四年级下册单词表国标手写斜体描红字帖.pdf
原创力文档

文档评论(0)