内蒙古工业大学 多媒体技术(第3章).ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
内蒙古工业大学 多媒体技术(第3章)

第三章 多媒体数据压缩技术 数据压缩的基本原理 数据压缩方法分类 预测编码 变换编码 信息熵编码 RLE编码 词典编码 3.1 数据压缩的基本原理 传统上用模拟方式表示声音和图象信息 易出故障,常产生噪音和信号丢失,且拷贝过程中噪音和误差逐步积累; 模拟信号不适合数字计算机加工处理。 数字化处理:巨大的数据量 采样定理: 仅当采样频率≥2倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号。 采用8bit数字化,从而1秒钟电视信号的数据量约为99.2Mbits。 即约为100Mbps。650MB的CD-ROM仅能存约1分钟的原始电视数据。若HDTV(1.2Gbps), 一张CD-ROM还存不下6秒钟的HDTV图象。 人说话的音频一般在20Hz到4KHz, 即人类语音的带宽为4KHz。依据采样定理, 设数字化精度为8b, 则1秒钟信号量为64Kbits。 因此, 人讲1分钟话的数据量为480KB。 数字化处理的关键问题-数据压缩 压缩的基础-数据冗余 空间冗余 时间冗余 信息熵冗余 结构冗余 知识冗余 视觉冗余 其它冗余 空间冗余 这是图象数据中经常存在的一种冗余。 在同一幅图象中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成象结构在数字化图象中就表现为数据冗余。 时间冗余 这是序列图象和语音数据中所经常包含的冗余。 图象序列中的两幅相邻的图象之间有较大的相关性,这反映为时间冗余。 人在说话时发音音频是一连续的渐变过程,而不是一个完全时间上独立的过程,因而存在时间冗余。 信息熵冗余 信息熵是指一组数据所携带的信息量,它定义为: H=-∑i=0N-1Pilog2Pi N为数据类数或码元个数, Pi为码元yi发生的概率. 为使信息编码单位数据量d接近于或等于H,应设: d=∑i=0N-1Pib(yi) 其中b(yi)是分配给码元yi的比特数, 理论上应取b(yi)=-log2Pi. 实际一般取b(y0)=b(y1)=…=b(yK-1). 例如, 英文字母编码码元长为7bit, 即b(y0)=b(y1)= … =b(yK-1)=7, 这样d必然大于H, 由此带来的冗余称为信息熵冗余或编码冗余。 结构冗余 有些图象从大域上看存着非常强的纹理结构,我们称它们在结构上存在有冗余. 例如布纹图象和草席图象 知识冗余 有许多图象的理解与某些基础知识有相当大的相关性。 例如,人脸的图象有固定的结构。比如说嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正脸图象的中线上等等。 这类规律性的结构可由先验知识和背景知识得到, 我们称此类冗余为知识冗余。 视觉冗余 人类视觉系统对于图象场的任何变化,并不是都能感知的。 例如,对于图象的编码处理时,由于压缩或量化截断引入了噪声而使图象发生了一些变化,如果这些变化不能为视觉所感知,仍认为图象足够好。 事实上人类视觉系统一般分辨能力约为26灰度等级,而一般图象量化采用28灰度等级,这类冗余我们称为视觉冗余。 其他冗余 例如由图象的空间非定常特性所带来的冗余。 3.2 数据压缩方法分类 根据解码后数据与原始数据是否完全一致,数据压缩方法划分为两类: 可逆编码(无失真编码) 解码图象与原始图象严格相同,压缩大约在2:1到5:1之间。如Huffman编码、算术编码、行程长度编码、词典编码等。 不可逆编码(有失真编码) 还原图象与原始图象存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍来调节。常用的有变换编码和预测编码 根据压缩的原理分类: 预测编码 利用空间中相邻数据的相关性来预测未来点的数据。差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)。 变换编码 将图象时域信号变换到频域空间处理。时域空间有强相关信号, 反映在频域上是某些特定区域内能量集中, 从而实现压缩. 正交变换如离散余弦变换DCT, 离散付立叶变换DFT和Walsh-Hadamard变换WHT.小波变换WT. 量化与向量量化编码 为了使整体量化失真最小, 就必须依照统计的概率分布设计最优的量化器。已知最优量化器是Max量化器。对象元点进行量化时, 也可以考虑一次量化多个点的向量量化。 信息熵编码 根据信息熵原理,让出现概率大的用短的码字表达,反之用长的码字表示。最常见的方法如Huffman编码、Shannon编码以及算术编码。 子带编码 将图象数据变换到频域后,按频域分带,然后用不同的量化器进行量化,从而达到最优的组合。或者分步渐近编码,随着解码数据的增加,图象逐渐清晰。 模型编码 编码时首先将图象中边界、轮廓、纹理等结构特征找出来,保存这些参数信息。

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档