第5章图像编码与压缩 - Read.PPT

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章图像编码与压缩 - Read

第五章 图象编码与压缩(1) 5.1 概述 图像数据需要一些有效的方法来存储和传输。 数据压缩技术就属于这样的有效技术,可以实现图像数据的快速存储和传输。 图像压缩主要是通过图像的数据编码实现的,数据编码不仅可以实现信息的压缩存储和传输,还可以实现信息保密。 5.1.1 数据压缩的基本概念 数据压缩:以较少的数据量表示原始信源的信息 数据压缩的目的:节省存储空间、传输时间、信号频带或发送能量等 图像压缩的原理:删除冗余的或者不相关的信息,减少数据量的技术。 这些概念无论是静态的文字、图像,还是动态的音频、视频都是适用的。 数据压缩的实现:信源编码和解码: 编码是对原始的信源数据进行压缩; 解码是编码的反过程,还原被压缩的数据。 信道编码主要针对编码传输的可靠性。 压缩的原理 冗余信息和不相关的信息 一个商人在旅行的归途中收到如下消息: 你的妻子,Helen,将于明天晚上6点零5分在波士顿的Logan机场接你。 删除冗余信息(redundancy)(已知信息): 你的妻子将于明晚6点零5分在Logan机场接你。 没有信息损失。 删除不相干信息(irrelevancy)(不需要): Helen将于明晚6点在Logan接你。 准确度损失不大,不影响信息的传达目的。 压缩算法 压缩算法包括无损压缩和有损压缩。 无损压缩的算法删除的仅仅是冗余的信息,因此可以在解压缩时精确复原原图像。 有损压缩的算法把不相干的信息也删除掉了,因此只能对原图像进行近似的重构。 有损压缩比无损压缩算法有更高的压缩比。 对于多数图像来说,为了得到更高的压缩比,保真度的轻微损失是可以接受的。 对于不允许进行修改的图像,则只能进行无损压缩。 压缩的原则 对于有损压缩,采用同一种方法,压缩比越大,信息损失越大,因此人们要在压缩比和保真度之间选择。 文件进行压缩和解压缩所需要的时间是不可忽略的。那些达到最高压缩比的算法常常不是最快的,所以,还要在压缩比和算法复杂度(速度)之间进行折中。 5.1.2 图像编码压缩的必要性 按一幅图像大概300KB的大小来计算,数字电视的数码率要达到400Mbps 这样的数据率和现在存储介质的容量、计算机的总线速度及网络的传输率不相匹配。 (数据量太大) 5.1.3 图像编码压缩的可能性 1.编码冗余 经典的数据压缩理论是建立在信息论基础之上。信息论明确指出,去除信源编码中的冗余量可以在对信息无损的前提下减少代表信息的数据量。(信息论的奠基人香农提出:I=D-du) 对图像进行编码时,如果编码码本(codebook)不能使每个像素所需的平均比特数最小,则说明存在编码冗余,就存在压缩的可能性。 2.像素间的相关性形成的冗余 图像由按一定规则排列起来的像素组成的。 同同一帧的邻近像素间、在活动图像中的同一位置的相邻帧像素间的灰度和色度往往相同或相近,我们称这种相关性为像素间冗余或空间冗余。 例如:二值传真信息的数据流是由大量的“白”数据串和“黑”数据串构成的。我们没有必要将全部数据加以发送,只需以“起始串,第二串长,第三串长,…”表示即可。 利用像素间的相关性进行压缩的原理实际上是将二维像素的矩阵表示成数据量更小的表达形式。 3.视觉特性和显示设备的误差容差允许压缩 受到生理和心理的影响,人眼对黑白与彩色信息的空间分辨率、时间分辨率等是有限的。光学上不一致的图像在视觉上可能是一样的。因此可以利用人眼的误差容差进行压缩 显示设备受到制作工艺的影响,有一定限度的失真 例如人在电视上看到的都是有一定程度失真的图像,但并不影响人们对画面的理解和欣赏 5.1.4 图像编码压缩的技术指标 熵: 假设有一个无记忆的信息源,它用到一个字母表{ak},k=0,1, …K-1。每一个字母出现的概率是P(ak)。在无记忆的消息中,字母出现的顺讯是无关紧要的,重要的是它是否出现。 Shannon定义了一种信息的度量标准, I(ak)=-log[P(ak)] 信息源的熵定义如下: H=E{I(ak)}=-∑P(ak)log[P(ak)] 信息源的熵总是非负的,当所有的符号出现的概率相等时,有最大值。 如果计算中的对数log是以2为底的,那么计算出来的信息熵就以比特(bit)为单位。 熵的度量信息量的大小,熵越大表示信息的不确定性越大。 图像数据的熵的定义为:如果一幅图像像素的灰度级为xi(i = 1,2,…,M),若xi出现的概率为p(xi),则图像熵定义为 H=-∑P(xi)log2[P(xi)] 图像熵表示像素灰度级集合的平均比特数。熵的单位为比特/字符。 2.图像冗余度与编码效率 冗余度r的定义为(R(x)指平均码长): r=1-H(x)/R(x) 编码效率η定义为: η=H(x)/R(x)=1/(1+r) 当平均码长接近H(x)时,冗余度下

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档