- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4.1 多媒体数据压缩的重要性与分类 多媒体技术最大难题是海量数据存储与传送电视信号、传输电视信号数字化后的数据量。那么数据量是否等于信息量? ??? 例如:一个512×512分辨率的一分钟视频需要如下的存储容量: 512× 512× 8 × 3=6291456=6.3M bit/s ??????? 6.3 × 30帧/s =188M bit/s ??????? 188/8 = 23.5MByte/s ???? 那么一张650MByte的光盘就只能存储 ???? 650M byte 硬盘/23.5M bytes/s = 27.5秒 ??? 例如:语音信号,正常人谈话音频20Hz~4KHz,采样定理,精度为8位,人类语言带宽为4KHz,则 ?? ??? 4K × 2 × 8 =64Kbit/s = 8Kbyte/s ??? 与图像相比: 23.5M/8K=3000倍。所以必须进行压缩。 知识:信息量与数据量的关系: I = D - du I— 信息量 D—数据量 du—冗余量 1.du在平时说话时是大量存在的。 2.中文广播员一分钟读180个汉字,一个汉字两个字节, 360个Byte 。 ??? ?? 采样1分钟,8K × 60 = 480 K Byte/分??? ? 480 K byte / 360 byte = 1000倍的冗余 3.中文百科全书扫描进入计算机冗余更大。 4.图像信息、视频信息的冗余就更大了。 一、为什么要进行数据压缩? (1)多媒体信息包括文本、数据、声音、动画、图形以及视频等多种媒体信息,经过数字化处理后其数据量非常大,如果不进行数据压缩处理,计算机系统就无法对它进行存储和交换; (2)多媒体信息中的图像、音频和视频这些媒体具有很大的压缩潜力。因为这些数据中存在着空间冗余、时间冗余、结构冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余等,它们为数据压缩技术的应用提供了可能的条件。 (3)数据压缩是以一定的质量损失为容限,质量损失一般在人眼允许的误差范围之内,压缩前后的图像如果不作详细的观察很难觉察出两者的差别。 (4)压缩处理一般由两个过程组成:一是编码过程,即将原始数据经过编码再进行压缩,以便于存储和传输;二是解码过程,即将编码数据还原为可使用的数据。 二、多媒体数据压缩编码可能性(冗余性)[为什么能压缩] 图像信息之所以能进行压缩是因为信息本身通常存在很大的冗余量? 1.空间冗余 ??? 例: 图象中的“A”是一个规则物体。光的亮度、饱和度及颜色都一样, 因此,数据A有很大的冗余。 2.时间冗余 ??? 例: 序列图象。(相邻画面的背景和移动画面) 以上面的视频连续画面为例,它的每一帧画面是由若干个像素组成的,因为动态图像通常反映的是一个连续的过程,它的相邻的帧之间存在着很大的相关性,从一幅画面到下一幅画面,背景与前景就可以没有太多的变化。也就是说,连续多帧画面在很大程度上是相似的,而这些相似的信息(或称作冗余信息)为数据的压缩提供了基础。 二、多媒体数据压缩编码可能性(冗余性) 3.信息熵冗余 ? l?? 信息量: 指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。 ? l?? 信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。 ? ???? 例如:从64个数中选出某一个数,可先问“是否大于32?”消除半数的可能,这样只要6次就可选出某数。这是因为每提问一次都会得到1比特的信息量。因此,在64个数中选定某一数所需的信息量是 log2 64=6(bits) 。 ??? 设从N个数中选任意一个数X的概率为 P(x),假定选定任意一个数的概率都相等,P(x)= 1/N,因此定义信息量:I(x)=log2N= -log2(1/N)= -log2P(x)=I[P(x)] 二、多媒体数据压缩编码可能性(冗余性) ? 4.结构冗余 ?v? 图象有非常强的纹理结构。 ?v? 如草席图结构上存在冗余。 ? 5.知识冗余 ?q? 图像的理解与某些基础知识有关。 ?q? 例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上…… ? 6.视觉冗余 ??? 视觉冗余是非均匀、非线性的。 ??? 例:人类视觉分辨率为2 ,但常数2就是数据冗余。 二、数据压缩方法的分类 常用压缩编码分为两大类: 一类是冗余压缩法;也称无损压缩或无失真压缩; 它是为保留原始多媒体对象(包括图像、语音和视频)而设计的。在无损压缩中,数据在压缩或解压缩过程中不会改变或损失,解压缩产生的数据是对原始对象的完整复制。
文档评论(0)