网站大量收购独家精品文档,联系QQ:2885784924

多媒体技术原理及应用_(1).pdf

  1. 1、本文档共160页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章多媒体数据压缩技术  信息表示与编码  常用的数据压缩技术  静态图像压缩标准JPEG  运动图像压缩编码标准MPEG  视听通信编码解码标准H.26X  声音压缩技术 2.1 信息表示与编码  数字化表示  彩色空间  多媒体数据转换 2.1.1 概述  传统上用模拟方式表示声音和图像信息。 易出故障,常产生噪音和信号丢失,且拷贝过程中 噪音和误差逐步积累; 模拟信号不适合数字计算机加工处理。  数字化处理:巨大的数据量。  采样定理: 仅当采样频率≥2倍的原始信号频率时,才能 保证采样后信号可被保真地恢复为原始信号。  采用8bit数字化,从而1秒钟电视信号的数据量 约为99.2Mbits 。 即约为100Mbps。650MB的CD-ROM仅能存约1 分钟的原始电视数据。若HDTV(1.2Gbps) , 一 张CD-ROM还存不下6秒钟的HDTV 图像。  人说话的音频一般在20Hz~4kHz , 即人类语音 的带宽为4kHz 。依据采样定理, 设数字化精度 为8b,则1秒钟信号量为64kbits 。 因此,人讲1分钟话的数据量为480kB 。  数字化处理的关键问题-数据压缩 压缩的基础-数据冗余  空间冗余  时间冗余  信息熵冗余  结构冗余  知识冗余  视觉冗余  其他冗余 空间冗余  这是图像数据中经常存在的一种冗余。  在同一幅图像中,规则物体和规则背景的表 面物理特性具有相关性,这些相关性的光成 象结构在数字化其他中就表现为数据冗余。 时间冗余  这是序列图像和语音数据中所经常包含的冗余。  图像序列中的两幅相邻的图像之间有较大的相关 性,这反映为时间冗余。  在语言中,由于人在说话时发音的音频是一连续 的渐变过程,而不是一个完全时间上独立的过 程,因而存在时间冗余。 信息熵冗余  信息熵是指一组数据所携带的信息量,它定义 为: H=- ∑ N-1P log P i=0 i 2 i N为数据类数或码元个数,P 为码元y 发生的概率. i i  为使信息编码单位数据量d 接近于或等于H ,应 设: d= ∑ N-1P b(y) i=0 i i 其中b(y) 是分配给码元y 的比特数,理论上应取 i i b(y)=- log P . 实际一般取b(y )=b(y )=…=b(y ) . i 2 i 0 1 K-1  例如,英文字母编码码元长为7bit,即 b(y )=b(y )= … =b(y )= 7,这样d必然大于H ,由 0 1 K-1 此带来的冗余称为信息熵冗余或编码冗余。 结构冗余  有些图像从大域上看存着非常强的纹理结构, 我们称它们在结构上存在有冗余。  例如,布纹图像和草席图像。 知识冗余  有许多图像的理解与某些基础知识有相当 大的相关性。  例如,人脸的图像有固定的结构。比如说 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正脸图像的中线上等。  这类规律性的结构可由先验知识和背景知 识得到,我们称此类冗余为知识冗余。 视觉冗余  人类视觉系统对于图像场的任何变化,并不是都 能感知的。  例如,对于图像的编码处理时,由于压缩或量化 截断引入了噪声而使图像发生了一些变化,如果 这些变化不

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档