网站大量收购闲置独家精品文档,联系QQ:2885784924

多媒体数据压缩的基本技术.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲 多媒体数据压缩的基本技术(1) Outline 多媒体数据压缩的理论依据 量化 标量量化 矢量量化 预测编码 差分脉冲编码调制 (DPCM) 自适应差分脉码调制 (ADPCM) 数据压缩可分为两类: 无损压缩 有损压缩 无损压缩是指压缩后的数据进行重构(还原,解压缩),重构后的数据与原来的数据完全相同。 有损压缩是指压缩后的数据进行重构,重构的数据与原来的数据有所不同,但不影响人对原始资料表达信息的理解。 多媒体数据压缩的理论依据 信息论 现在科学领域中的一个重要分支 Shannon所创立的信息论对数据压缩有极为重要的指导意义 给出了数据压缩的理论极限 指明了数据压缩的技术途径 为通信技术的发展奠定了理论基础 两个基本概念:熵和信源熵 Entropy(熵)的概念 : (1) 熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。 (2) 某个事件的信息量用 Ii = -log2Pi 表示 , 其中Pi为第 i 个事件的概率 信源熵的定义 无损编码定理 离散信源X无损编码所能达到的最小速率不能低于该信源的信源熵,即: 信源编码定理 (有损编码定理) 对于给定的信源,在允许一定的失真D情况下,存在一率失真函数R(D),当编码速率R不低于R(D)时,编码失真能够不大于D。 ◇ R(D)一般不容易计算 ◇ 该定理没有给出编码方法 熵编码(保熵编码 、无损压缩 ) 定长编码 香农-范诺(Shannon- Fano)编码 霍夫曼编码 算术编码 Ziv-Lempel编码(70年代末J.Ziv和A.Lempel) 行程编码(Run Length Encoding,RLE) 举例说明: 有一幅40个象素组成的灰度图像,灰度共有5级,分别用符号A、B、C、D和E表示,40个象素中出现灰度A的象素数有15个,出现灰度B的象素数有7个,出现灰度C的象素数有7个等等,如右边所示。 如果用3个位表示5个等级的灰度值(定长编码),也就是每个象素用3位表示,编码这幅图像总共需要120位。 香农-范诺(Shannon- Fano) 编码 按照符号出现的频度或概率排序,然后使用递归方法分成两个部分,每一部分具有近似相同的次数。 Shannon(1948年)和Fano(1949年)最早阐述和实现这种编码,因此被称为香农-范诺(Shannon- Fano)算法。这种方法采用从上到下的方法进行编码。 香农-范诺编码举例 霍夫曼编码 霍夫曼(Huffman)在1952年提出了一种编码方法,是从下到上的编码方法。 基本思想是:对于出现概率较大的符号取较短的码长,而对概率较小的符号取较长的码长。 是一种变长码 ,霍夫曼码通常被称为最优码 仍以上一个例子说明它的编码步骤: 1. 初始化,根据符号概率的大小按由大到小顺序对符号进行排序 2. 把概率最小的两个符号组成一个节点,D和E组成节点P1 3. 重复步骤2,得到节点P2、P3和P4,形成一棵“树”,其中的P4称为根节点 4. 从根节点P4开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。 5. 从根节点P4开始顺着树枝到每个叶子分别写出每个符号的代码 上例按照霍夫曼编码的结果(总共90位 ) 霍夫曼码的码长虽然是可变的,但却不需要另外附加同步代码。例如,码串中的第1位为0,那末肯定是符号A,因为表示其他符号的代码没有一个是以0开始的,因此下一位就表示下一个符号代码的第1位。同样,如果出现“110”,那么它就代表符号D。如果事先编写出一本解释各种代码意义的“词典”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码。 采用霍夫曼编码时需要注意的问题: 霍夫曼码没有错误保护功能,在译码时,如果码串中没有错误,那么就能一个接一个地正确译出代码。但如果码串中有错误,哪怕是1位出现错误,不但这个码本身译错,更糟糕的是一错一大串,全乱了套,这种现象称为错误传播(error propagation)。计算机对这种错误是无能为力的,说不出错在哪里,更谈不上去纠正它。 霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑 。 量化 量化是将具有连续幅度值的输入信号转换到只有有限个幅度值的输出信号的过程。 标量量化 均匀量化 非均匀量化 对数量化 自适应量化 矢量量化 标量量化 ◆ 标量量化对信号的每个样点分别量化 ◆ 连续信号的量化过程是将给定的连续信号幅度值x变成 有限个离散幅度值集合中的一个值y的过程 数学描述: 对取值连续的无限集合{x

文档评论(0)

gpcjc1996 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档