内蒙古工业大学多媒体技术(第3章).ppt

下载文档 降价啦

20
0
约9.11千字
约 71页
2017-06-17 发布于湖北
举报
版权申诉
保障服务

内蒙古工业大学多媒体技术(第3章).ppt

1、本文档共71页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

内蒙古工业大学多媒体技术(第3章)

第三章多媒体数据压缩技术数据压缩的基本原理数据压缩方法分类预测编码变换编码信息熵编码 RLE编码词典编码 3.1 数据压缩的基本原理传统上用模拟方式表示声音和图象信息易出故障，常产生噪音和信号丢失，且拷贝过程中噪音和误差逐步积累；模拟信号不适合数字计算机加工处理。数字化处理：巨大的数据量采样定理: 仅当采样频率≥2倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号。采用8bit数字化,从而1秒钟电视信号的数据量约为99.2Mbits。即约为100Mbps。650MB的CD-ROM仅能存约1分钟的原始电视数据。若HDTV(1.2Gbps), 一张CD-ROM还存不下6秒钟的HDTV图象。人说话的音频一般在20Hz到4KHz, 即人类语音的带宽为4KHz。依据采样定理, 设数字化精度为8b, 则1秒钟信号量为64Kbits。因此, 人讲1分钟话的数据量为480KB。数字化处理的关键问题－数据压缩压缩的基础－数据冗余空间冗余时间冗余信息熵冗余结构冗余知识冗余视觉冗余其它冗余空间冗余这是图象数据中经常存在的一种冗余。在同一幅图象中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成象结构在数字化图象中就表现为数据冗余。时间冗余这是序列图象和语音数据中所经常包含的冗余。图象序列中的两幅相邻的图象之间有较大的相关性,这反映为时间冗余。人在说话时发音音频是一连续的渐变过程,而不是一个完全时间上独立的过程,因而存在时间冗余。信息熵冗余信息熵是指一组数据所携带的信息量,它定义为： H=-∑i=0N-1Pilog2Pi N为数据类数或码元个数, Pi为码元yi发生的概率. 为使信息编码单位数据量d接近于或等于H,应设： d=∑i=0N-1Pib(yi) 其中b(yi)是分配给码元yi的比特数, 理论上应取b(yi)=-log2Pi. 实际一般取b(y0)=b(y1)=…=b(yK-1). 例如, 英文字母编码码元长为7bit, 即b(y0)=b(y1)= … =b(yK-1)=7, 这样d必然大于H, 由此带来的冗余称为信息熵冗余或编码冗余。结构冗余有些图象从大域上看存着非常强的纹理结构，我们称它们在结构上存在有冗余. 例如布纹图象和草席图象知识冗余有许多图象的理解与某些基础知识有相当大的相关性。例如,人脸的图象有固定的结构。比如说嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正脸图象的中线上等等。这类规律性的结构可由先验知识和背景知识得到, 我们称此类冗余为知识冗余。视觉冗余人类视觉系统对于图象场的任何变化,并不是都能感知的。例如,对于图象的编码处理时,由于压缩或量化截断引入了噪声而使图象发生了一些变化,如果这些变化不能为视觉所感知,仍认为图象足够好。事实上人类视觉系统一般分辨能力约为26灰度等级,而一般图象量化采用28灰度等级,这类冗余我们称为视觉冗余。其他冗余例如由图象的空间非定常特性所带来的冗余。 3.2 数据压缩方法分类根据解码后数据与原始数据是否完全一致，数据压缩方法划分为两类：可逆编码(无失真编码) 解码图象与原始图象严格相同，压缩大约在2:1到5:1之间。如Huffman编码、算术编码、行程长度编码、词典编码等。不可逆编码(有失真编码) 还原图象与原始图象存在一定的误差，但视觉效果一般可以接受，压缩比可以从几倍到上百倍来调节。常用的有变换编码和预测编码根据压缩的原理分类：预测编码利用空间中相邻数据的相关性来预测未来点的数据。差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)。变换编码将图象时域信号变换到频域空间处理。时域空间有强相关信号, 反映在频域上是某些特定区域内能量集中, 从而实现压缩. 正交变换如离散余弦变换DCT, 离散付立叶变换DFT和Walsh-Hadamard变换WHT.小波变换WT. 量化与向量量化编码为了使整体量化失真最小, 就必须依照统计的概率分布设计最优的量化器。已知最优量化器是Max量化器。对象元点进行量化时, 也可以考虑一次量化多个点的向量量化。信息熵编码根据信息熵原理,让出现概率大的用短的码字表达,反之用长的码字表示。最常见的方法如Huffman编码、Shannon编码以及算术编码。子带编码将图象数据变换到频域后,按频域分带,然后用不同的量化器进行量化,从而达到最优的组合。或者分步渐近编码,随着解码数据的增加,图象逐渐清晰。模型编码编码时首先将图象中边界、轮廓、纹理等结构特征找出来,保存这些参数信息。

您可能关注的文档

文档评论（0）

dajuhyy + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

内蒙古工业大学多媒体技术(第3章).ppt