- 1、本文档共160页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章多媒体数据压缩技术
信息表示与编码
常用的数据压缩技术
静态图像压缩标准JPEG
运动图像压缩编码标准MPEG
视听通信编码解码标准H.26X
声音压缩技术
2.1 信息表示与编码
数字化表示
彩色空间
多媒体数据转换
2.1.1 概述
传统上用模拟方式表示声音和图像信息。
易出故障,常产生噪音和信号丢失,且拷贝过程中
噪音和误差逐步积累;
模拟信号不适合数字计算机加工处理。
数字化处理:巨大的数据量。
采样定理:
仅当采样频率≥2倍的原始信号频率时,才能
保证采样后信号可被保真地恢复为原始信号。
采用8bit数字化,从而1秒钟电视信号的数据量
约为99.2Mbits 。
即约为100Mbps。650MB的CD-ROM仅能存约1
分钟的原始电视数据。若HDTV(1.2Gbps) , 一
张CD-ROM还存不下6秒钟的HDTV 图像。
人说话的音频一般在20Hz~4kHz , 即人类语音
的带宽为4kHz 。依据采样定理, 设数字化精度
为8b,则1秒钟信号量为64kbits 。
因此,人讲1分钟话的数据量为480kB 。
数字化处理的关键问题-数据压缩
压缩的基础-数据冗余
空间冗余
时间冗余
信息熵冗余
结构冗余
知识冗余
视觉冗余
其他冗余
空间冗余
这是图像数据中经常存在的一种冗余。
在同一幅图像中,规则物体和规则背景的表
面物理特性具有相关性,这些相关性的光成
象结构在数字化其他中就表现为数据冗余。
时间冗余
这是序列图像和语音数据中所经常包含的冗余。
图像序列中的两幅相邻的图像之间有较大的相关
性,这反映为时间冗余。
在语言中,由于人在说话时发音的音频是一连续
的渐变过程,而不是一个完全时间上独立的过
程,因而存在时间冗余。
信息熵冗余
信息熵是指一组数据所携带的信息量,它定义
为:
H=- ∑ N-1P log P
i=0 i 2 i
N为数据类数或码元个数,P 为码元y 发生的概率.
i i
为使信息编码单位数据量d 接近于或等于H ,应
设:
d= ∑ N-1P b(y)
i=0 i i
其中b(y) 是分配给码元y 的比特数,理论上应取
i i
b(y)=- log P . 实际一般取b(y )=b(y )=…=b(y ) .
i 2 i 0 1 K-1
例如,英文字母编码码元长为7bit,即
b(y )=b(y )= … =b(y )= 7,这样d必然大于H ,由
0 1 K-1
此带来的冗余称为信息熵冗余或编码冗余。
结构冗余
有些图像从大域上看存着非常强的纹理结构,
我们称它们在结构上存在有冗余。
例如,布纹图像和草席图像。
知识冗余
有许多图像的理解与某些基础知识有相当
大的相关性。
例如,人脸的图像有固定的结构。比如说
嘴的上方有鼻子, 鼻子的上方有眼睛,
鼻子位于正脸图像的中线上等。
这类规律性的结构可由先验知识和背景知
识得到,我们称此类冗余为知识冗余。
视觉冗余
人类视觉系统对于图像场的任何变化,并不是都
能感知的。
例如,对于图像的编码处理时,由于压缩或量化
截断引入了噪声而使图像发生了一些变化,如果
这些变化不
文档评论(0)