第四章多媒体数据压缩.pptVIP

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章多媒体数据压缩

第四章 多媒体数据压缩 一、数据压缩的基本概念 1. 为什么要进行数据压缩 原因1:多媒体(图、文、音、视、动)信息经过数字化处理后其数据量非常大,如果不进行数据压缩处理,计算机系统就无法对它进行存储和交换。 原因2:图像、音频、视频等媒体信息数据具有很大的压缩潜力,因为这些数据中存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。压缩后的数据信息便于存储与传输。 2. 什么是数据压缩 数据压缩是一种数据处理的方法,它的作用是将一个文件的数据容量减小,而又基本保持原来文件的信息方法。 压缩处理一般由两个过程(编码过程和解码过程)组成。 编码过程:将原始数据经过编码进行压缩,以便存储与传输。 解码过程:对编码数据进行解码,还原为可以使用的数据。 3. 数据压缩方法的分类 目前常用的压缩编码方法可以分为两大类:无损压缩法和有损压缩法 无损压缩法:经压缩后不损失原信息的内容,这一种可逆压缩,称为“无损压缩”。 有损压缩法:经压缩后不能将原来的文件信息完全保留的压缩,是不可逆压缩的方式,称为“有损压缩”。 4. 评价压缩的主要指标 高的压缩比:一般用压缩前后每个像素所需的位数bpp(Bits per pixel)来描述压缩比。其值越大,则称压缩比越高。 短的压缩和解压缩时间:用数学运算所实现的压缩与解压缩时间越短越好。 好的恢复质量:对于图像、声音和视频影像,数据经压缩后可以允许信息的部分丢失。这种情况下信息经解压缩后不可能完全恢复,但尽量期望有较好的恢复质量。 通用性强:所有同类型的文件应当采用一个通用压缩方法,最好能提供多种压缩比和压缩质量的选择。 软硬件开销:软硬件压缩与解压缩越经济越好。 二、量化 1. 量化的概念和原理 量化的作用是在图像质量或声音质量达到一定保真度的前提下,舍弃那些对视觉或听觉影响不大的信息(即使数据的比特率下降)。 量化的过程是从模拟信号到数字信号的映射。模拟量是连续量,而数字量是离散量,因此量化操作实质上用有限的离散量代替无限的连续模拟量的多对一的映射操作。 量化概念主要来自于从模拟量到数字量的转换,即A/D转换,也就是通过采样把连续的模拟量离散化。 2. 标量量化 标量量化是一维量化,它使用一个量化器进行量化,每个采样的量化都和其他采样无关。A/D转换器中所使用的PC编码器是最典型的实现例子。标量量化的输入-输出特性采用阶梯函数形式。 标量量化又可分为均匀量化、非均匀量化和自适应量化。 3. 矢量量化 进行量化时除了每次仅量化一个点的作法外,也可以一次量化多个点,这种方法就是矢量量化。 矢量量化又称多维量化,是从称为码本的码字集合中选出最紧密适配于输入序列的一个码字来近似一个采样序列,这种方法以输入序列与选出码字之间失真最小为依据。矢量量化与标量量化相比有更大的数据压缩能力。 搜索 传输矢量下标i 码本C 查表 码本C 输入矢量 输出矢量 发送站 接收端 i 编码 矢量量化编码解码框图 4. 量化器 对模拟量进行数字化时,要经历一个量化过程,需要使用量化器。如果要量化的数据在其动态范围内的概率的密度服从均匀分布,则量化级别可以等间隔地分配。 量化器的设计方法有两种: 第一种是当量化器的量化电平数K已给定时,根据量化误差的均匀值取最小值的原则来设计; 第二种是给出固定的量化噪声或失真要求,以量化电平总数K尽量小为原则来设计。 三、声音数据的压缩 声音数据压缩中,主要包括语音和音乐的数据压缩。 语音的频率带宽只有3.2KHz,音乐的频率带宽通常有20KHz。由于二者的声音覆盖的的频率范围不同,压缩过程中实现的方法也不同。 语音的技术通常采用波形编码技术或者是基于语音生成模型的压缩技术。 音乐信号的压缩也可以用语音的压缩技术来实现,但当压缩比较高时,重构音乐信号的质量通常不能令人满意。 四、静态图像的压缩 1. 静态图像的无损压缩 行程(RLC)编码法 四叉树编码法 霍夫曼(Huffman)编码法 LZW编码法 算术编码 行程编码法 这是一种直观通用的位映射图像的压缩技术。它的基本思想是:把表征图像每个数据(亮度及颜色值)按照图像的像素位置,从左到右、由上而下地排列成一个数据系列,然后按这一序列顺序编码。每当遇到一串相同数据时就用该数据及其重复的次数来代替原来的数据串。 这种方法能有效地压缩图像中连续的相同颜色造成的相关性,适用于压缩颜色数目较少、色块较大图像。通常用计算机绘制的图像,适合于游程编码压缩。 (3,8) (3,1) (5,7) (5,8) (5,3) (6,5) (6,2) (2,6) (2,8) 行程编码举例 四叉树编码法 这是属于位映射图像的压缩技术,如果图像中包括大块的亮度及颜色值相同的区域,可采用这种方法。它的基本思想是:首先

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档