[物理]第三章 视频压缩编码的基本原理和方法-上课用-有删减.pptVIP

[物理]第三章 视频压缩编码的基本原理和方法-上课用-有删减.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[物理]第三章 视频压缩编码的基本原理和方法-上课用-有删减

* 图:JPEG将源图像划分为若干个子块,每个子块包含8×8个像素 * 现在来看DCT处理前后数据发生了哪些变化?图像一般可以用灰度(或彩色)来表示,为讨论问题方便,我们取图像中一个被放大了的8×8个像素的子块作为示例。假设每个像素的灰度值(或颜色值)用8比特来表示,那么共有256个灰度等级(或256种颜色)。这样,我们可以定义一个8行×8列的二维数组来表示图像子块中各像素的灰度值和颜色值。于是我们就得到了二维数组矩阵。不失一般性,如果图像是真彩色图像,即每个像素的颜色值需用24比特表示,需要用3个8行×8列的数组来表示这个子块。每一个数组表示其中一个8比特组合的像素值。离散余弦变换作用于每一个数组。 * 一个被放大的8×8个像素的子块 表示图像灰度 (或颜色)的矩阵 经过离散余弦变换,量化取整后频率系数矩阵T * 其中, 否则, 公式表明:DCT对一个8×8的矩阵P进行处理,得到一个8×8的频率系数矩阵。不解释这个公式是怎么来的,它的物理意义是:这个变换的基本运算是将信号从一种表达形式(空间域,即图像的像素值)变成另一种等同的表达形式(频率域,即频率系数),并且这种变换过程是可逆的。数组T中每个元素称为变换系数,这些系数都有明确的物理意义:如当i,j=0时的值称为DC系数,它与数组的平均值有关。矩阵的其余的值称为AC系数。随着i和j值的增加,相应系数分别代表逐步增加的水平空间频率分量和垂直空间频率分量的大小。 进行离散余弦变换,要用到如下的一个公式: * 从矩阵中可以看出有一个倾向:随着元素离DC系数越来越远,它的值就倾向于越来越小。这意味着通过DCT来处理数据,已将图像的表示集结到输出矩阵的左上角的系数,这个系数就比其他系数携带了更多关于图像的有用信息,同时DCT矩阵的右下部分系数几乎不包含有用信息。由于计算机屏幕上的大多数图像都由低频信息构成,因此这一点是很有意义的。这样,系数越来越小,而且对描述图像越来越不重要。所以说DCT确定了图像的一部分信息,这些信息可被“扔掉”并且不会对图像的质量带来严重影响。 * 由以上的介绍可知,DCT的优点很多,主要表现为: 已证明DCT是许多图像的最佳变换; DCT可以将N×N图像的空间域转换为频率域,只需要少量的数据点表示图像; DCT产生的系数很容易被量化,以获得好的块压缩; DCT算法的性能很好,可以进行高效的运算,因此使它在硬件和软件中都容易实现; DCT算法是对称的,逆DCT算法可用来解压缩图像。 视频压缩编码方法的分类 视频压缩编码方法有许多种,从不同的角度出发有不同的分类方法 1、按解码重建图像和原始图像是否相同分类 2、按压缩编码算法的原理分类 3、按待编码图像的不同属性分类 按解码重建图像和原始图像是否相同分类 分为无失真编码和限失真编码 1)无失真编码又称信息保持编码、熵编码。熵指的是具体数据所含的平均信息量,定义为在不丢失信息的前提下描述该信息内容所需的最小比特数。 熵编码是纯粹基于信号统计特性的一种编码方法,它利用图像信源概率分布的不均匀性,通过变长编码来减少信源数据冗余,解码后的重建图像和压缩编码前的原始图像完全相同,没有失真。 2)限失真编码又称非信息保持编码、熵压缩编码,解码重建图像和原始图像有一定差别,但是这些失真被控制在一定限度内。 按压缩编码算法的原理分类 可将图像压缩编码方法分为基于图像统计特性、基于人眼视觉特性、基于内容(对象)和基于模型等方法。 在实际编码中,常常同时利用图像的统计特性和人眼视觉特性才能有效的编码 基于图像统计特性的编码方法中,有预测编码、变换编码、霍夫曼编码、算术编码、游程编码等。 基于人眼视觉特性和基于内容的编码方法中,有亚采样、子带编码、多分辨率编码、矢量量化、形状编码、纹理编码等。 基于模型的编码方法中,有模型基编码、语义编码等。 按待编码图像的不同属性分类 以图像的光学特征来分,有单色、彩色、多光谱图像的压缩编码;以灰度等级来分,有二值图像与灰度图像的压缩编码;若以动静来分,有静止图像和运动图像序列的压缩编码。 在实际的应用中,往往采用混合编码方法来达到最佳的压缩效果。 视频压缩编码方法简介 熵编码 信息论的基本概念 设信源X可发出的消息符号集合 A={ai=|i=1,2,3…,m},并设X发出符号ai的概率为P(ai),则定义符号出现的自信息量为I(ai)=-log p(ai) 通常,上式中的对数取2为底,这时定义的信息量单位为bit(比特) 把上述概念应用到图像信源来计算熵值,比较直观,简便的方法是把每个像素的样本值定义为符号。 若考虑实际图像中相邻像素之间存在相关性,像素之间不是相互独立的特点,用

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档