第3章多媒体数切据压缩.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章多媒体数切据压缩

第3章 多媒体数据压缩 3.1 数据压缩的基本原理和方法 3.2 音频压缩标准 3.3 图像压缩标准 3.4 视频压缩标准 3.1 数据压缩的基本原理和方法 所谓“数据”,通常是指信源所发信号的数字化表示或记录 所谓数据压缩,就是以最少的数码表示信源所发出的信号,减少容纳给定消息集合或数据采样集合的信息空间。信息空间亦即被压缩对象是指: 物理空间:如储存器、磁盘、光盘等数据存储介质 时间区间:如传输给定消息集合所需的时间 电磁频谱区域:如传输给定消息集合所需的带宽等。 压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。 3.1 数据压缩的基本原理和方法 1950年在计算机普及之前,世界范围内信息量的增长速度是每150年翻一番;随着计算机的广泛应用,1950-1960年间信息量的增长达到每10年翻一番;1960-1992年间缩短为每5年翻一番。人们预计2020年以后信息量每73天就要翻一番。 几个未经压缩的数字化信息的例子: B5(180x255mm)、300dpi(12像素点/mm)-------6.61MB/页----CD-ROM 98页 双声道立体声激光唱盘(CD-DA): 44.1x103x16x2=1.41Mb/s,650M :---- 约一小时 数字音频磁带(DAT):48x103x16=768kb/s 3.1 数据压缩的基本原理和方法 SIF(Source Input Format)格式,NTSC制式,4:4:4采样 每帧数据:352x240x3=253KB 每秒数据:253x30=7.603MB/s CCIR(International Consultative Committee for Radio)格式,PAL制式,4:4:4采样 每帧数据:720x576x3=1.24MB 每秒数据:1.24x25=31.3MB/s 实验表明,176×144的YUV原始视频在10Mbps的LAN上传送速率是3帧/秒左右。 陆地卫星遥感图片的水平和垂直分辨率分别为2340及3240,四 波 段、 采样精度为7bit的一幅图像的数据量为212Mb,按每天30幅计算,其数据量为6.36Gb,而每年的数据量则高达2300Gb。 3.1 数据压缩的基本原理和方法 压缩的可行性 信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。 空间冗余、时间冗余、视觉冗余、听觉冗余等 3.1.1 数据压缩技术的性能指标 有三个关键参数评价一个压缩系统 压缩比 压缩性能常常用压缩比定义(输入数据和输出数据比) 图象质量 无损压缩 (图象质量不变) 有损压缩, 失真情况很难量化,只能对测试的图象进行估计。 压缩和解压的速度 压缩和解压可能不同时用,压缩、解压速度分别估计。 3.1.2 数据冗余的类型与压缩方法分类 数据冗余的类型 空间冗余 时间冗余 信息熵冗余 视觉冗余 听觉冗余 其它冗余 结构冗余 知识冗余 3.1.2 数据冗余的类型与压缩方法分类 空间冗余 这是图像数据中经常存在的一种冗余。在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余。 3.1.2 数据冗余的类型与压缩方法分类 时间冗余 这是序列图像(电视图像、运动图像)和语音数据中经常出现的冗余。 3.1.2 数据冗余的类型与压缩方法分类 信息熵冗余(编码冗余) 信息熵(entropy)是指一组数据所携带的信息量 H= -? Pi?log2Pi (i=0~k-1) k为数据类数或码元个数 Pi为第i个数据类数或码元发生的概率 d=?Pi?b(yi) (i=0~k-1) b(yi)是分配给码元yi的比特数,理论上应该是b(yi) = -log2Pi ,实际中很难估计出码元的的概率,当选用等概率时,d则大于H 3.1.2 数据冗余的类型与压缩方法分类 视觉冗余 人类视觉系统对于图像场的任何变化,并不是都能感知的。 人类视觉系统一般的分辨能力约为26灰度级 一般图像量化采用28灰度级 听觉冗余 人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,存在听觉冗余。 知识冗余 有许多图像的理解与某些基础知识有相当大的相关性。例如人脸的图像有固定的结构。 3.1.2 数据冗余的类型与压缩方法分类 结构冗余 3.1.2 数据冗余的类型与压缩方法分类 根据解码后数据与原始数据是否完全一致可以分为两大类: 一类是熵编码、冗余压缩法,也称无损压缩法、无失真压缩法; 多用于文本、数据的压缩, 非线性编辑系统为了保证视频质量,有些高档系统采用的是无失真压缩方法。 二是熵压缩法,也称有损压缩法、有失真压缩法。 图像、声音、动态

文档评论(0)

173****1616 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档