网站大量收购闲置独家精品文档,联系QQ:2885784924

[互联网]多媒体数据压缩.ppt

  1. 1、本文档共101页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[互联网]多媒体数据压缩

第三讲 多媒体数据压缩 3.1 数据压缩的 基本原理和方法 3.1 数据压缩的基本原理和方法 压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。 例如,一幅具有中等分辨率(640×480)的真彩色图像(24b/像素),它的数据量约为7.37Mb/帧,一个 100MB(Byte)的硬盘只能存放约100帧图像。若要达到每秒25帧的全动态显示要求,每秒所需的数据量为184Mb,而且要求系统的数据传输率必须达到184Mb/s。对于声音也是如此,若采用16b样值的PCM编码,采样速率选为44.1kHZ,则双声道立体声声音每秒将有176KB的数据量。 3.1 数据压缩的基本原理和方法 视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。熵指的是具体数据所含的平均信息量,定义为在不丢失信息的前提下描述该信息内容所需的最小比特数。 原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。 3.1.1 数据压缩技术的性能指标 节省图象或视频的存储容量,增加访问速度,使数字视频能在PC机上实现,需要进行视频和图象的压缩。 有三个关键参数评价一个压缩系统 压缩比 图象质量 压缩和解压的速度 另外也必须考虑每个压缩算法所需的硬件和软件。 3.1.2 数据冗余的类型与压缩方法分类 1. 数据冗余的类型 一幅图象中同一种颜色不止一个象素点,若相邻的象素点的值相同,象素点间(水平、垂直)有冗余。 (空间冗余) 当图象的一部分包含占主要地位的垂直的源对象时,相邻线间存在冗余。 (空间冗余) 若图象稳定或只有轻微的改变,运动序列帧间存在冗余。 (时间冗余) 3.1.2 数据冗余的类型与压缩方法分类 空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。 时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。 3.1.2 数据冗余的类型与压缩方法分类 信息熵冗余:信源编码时,当分配给第i个码元类的比特数b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。 3.1.2 数据冗余的类型与压缩方法分类 视觉冗余:人类视觉系统(HVS)是世界上最好的图像处理系统,但并非十分完美。HVS对图像的注意是非均匀和非线性的,并不是对于图像中的任何变化都能感知。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。 3.1.2 数据冗余的类型与压缩方法分类 举几个简单的例子说明: 人眼对颜色的空间分辨率低于对亮度信号的分辨率。在ITU-R BT.601建议中,Y:U:V可选4:2:2就是利用这个特性,将色差信号的空间分辨率减半,仍可得到很好的图像主观质量,但数据量却是4:4:4格式的2/3。 人眼对画面静止部分的空间分辨率高于对运动部分的空间分辨率。所以,对静止图像或慢速活动图像可充分利用其时间轴的强相关性,降低时间轴采样率或进行帧间编码;而对快速活动图像,利用人眼的空间分辨率下降的特点,可以降低空间采样率,以达到数据压缩的目的。 3.1.2 数据冗余的类型与压缩方法分类 举几个简单的例子说明: 人眼不能观察亮度的细小变化,即存在视觉阈值,而且此阈值随着图像内容的变化而变化。在平坦区,阈值低、对失真较敏感;在边缘和纹理区,对失真不敏感,这就是视觉掩蔽效应。这种特性被广泛用来提高压缩比。 人眼对屏幕中心的失真敏感,对屏幕四周的失真不敏感。因此,对四周的粗量化也可以节约码子。 3.1.2 数据冗余的类型与压缩方法分类 听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。 结构冗余:在有些图像的部分区域内有着很相似的纹理结构,或是图像的各个部分之间存在着某种关系,例如自

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档