多媒体技术原理及应用_(1).pdf

下载文档 降价啦

5
0
约4.03万字
约 160页
2019-02-15 发布于山东
举报
版权申诉
保障服务

多媒体技术原理及应用_(1).pdf

1、本文档共160页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第2章多媒体数据压缩技术  信息表示与编码  常用的数据压缩技术  静态图像压缩标准JPEG  运动图像压缩编码标准MPEG  视听通信编码解码标准H.26X  声音压缩技术 2.1 信息表示与编码  数字化表示  彩色空间  多媒体数据转换 2.1.1 概述  传统上用模拟方式表示声音和图像信息。易出故障，常产生噪音和信号丢失，且拷贝过程中噪音和误差逐步积累；模拟信号不适合数字计算机加工处理。  数字化处理：巨大的数据量。  采样定理：仅当采样频率≥2倍的原始信号频率时，才能保证采样后信号可被保真地恢复为原始信号。  采用8bit数字化，从而1秒钟电视信号的数据量约为99.2Mbits 。即约为100Mbps。650MB的CD-ROM仅能存约1 分钟的原始电视数据。若HDTV(1.2Gbps) ，一张CD-ROM还存不下6秒钟的HDTV 图像。  人说话的音频一般在20Hz~4kHz ，即人类语音的带宽为4kHz 。依据采样定理，设数字化精度为8b，则1秒钟信号量为64kbits 。因此，人讲1分钟话的数据量为480kB 。  数字化处理的关键问题－数据压缩压缩的基础－数据冗余  空间冗余  时间冗余  信息熵冗余  结构冗余  知识冗余  视觉冗余  其他冗余空间冗余  这是图像数据中经常存在的一种冗余。  在同一幅图像中，规则物体和规则背景的表面物理特性具有相关性，这些相关性的光成象结构在数字化其他中就表现为数据冗余。时间冗余  这是序列图像和语音数据中所经常包含的冗余。  图像序列中的两幅相邻的图像之间有较大的相关性，这反映为时间冗余。  在语言中，由于人在说话时发音的音频是一连续的渐变过程，而不是一个完全时间上独立的过程，因而存在时间冗余。信息熵冗余  信息熵是指一组数据所携带的信息量，它定义为： H=- ∑ N-1P log P i=0 i 2 i N为数据类数或码元个数，P 为码元y 发生的概率. i i  为使信息编码单位数据量d 接近于或等于H ，应设： d= ∑ N-1P b(y) i=0 i i 其中b(y) 是分配给码元y 的比特数，理论上应取 i i b(y)=- log P . 实际一般取b(y )=b(y )=…=b(y ) . i 2 i 0 1 K-1  例如，英文字母编码码元长为7bit，即 b(y )=b(y )= … =b(y )= 7，这样d必然大于H ，由 0 1 K-1 此带来的冗余称为信息熵冗余或编码冗余。结构冗余  有些图像从大域上看存着非常强的纹理结构，我们称它们在结构上存在有冗余。  例如，布纹图像和草席图像。知识冗余  有许多图像的理解与某些基础知识有相当大的相关性。  例如，人脸的图像有固定的结构。比如说嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于正脸图像的中线上等。  这类规律性的结构可由先验知识和背景知识得到，我们称此类冗余为知识冗余。视觉冗余  人类视觉系统对于图像场的任何变化，并不是都能感知的。  例如，对于图像的编码处理时，由于压缩或量化截断引入了噪声而使图像发生了一些变化，如果这些变化不