网站大量收购独家精品文档,联系QQ:2885784924

第6章多媒体数据压缩技术.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.Zig-Zag扫描:一种将二维数组转变为一维数组的Z字形扫描方法。 (1)Zig-Zag扫描的依据:在量化后的DCT系数矩阵中,非0的数据主要都集中于矩阵的左上角。 ①分片:将图像分割成许多横向条(或称“片”),每条的宽度为16个采样点。 ④宏块的形成:由4个8×8的亮度(Y)像块组成的宏区块和与之重叠 的两个8×8的色差(U,V )像块,这6个像块组成一个宏块。如图: 2.FDCT变换 由f(x,y),变换为8×8=64个FDCT系数F(u,v)。 3.量化(区域滤波法) 4.差值编码与Zig-Zag扫描后行程编码 5.熵编码并输出数据流 5.熵编码并输出数据流 6.2.3常用的有损压缩方法(熵压缩) 预测编码: 根据原始的离散信号之间存在关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编码。常用的有PCM(脉冲编码调制),拆分脉冲编码调制(DPCM),自适应拆分脉冲编码调制(ADPCM). 第6章 多媒体数据压缩技术 6.2.3常用的有损压缩方法(熵压缩) ● 差分脉冲编码调制(DPCM) 差值编码 ● 差分脉冲编码调制原理 ①在发送端:处理或传输的不是图像中当前样值本身,而是该样值与前一个(相邻)样值的差值,则这些差值绝大多数是很小的或为零,可以用短码来表示,而对那些出现几率较少的较大差值,用长码来表示,则可使总体码数下降。 ②在接收端:将已得到的前一样值与刚收到的差值相加,就可还原出所要的当前样值。 对相邻的样值差值进行变字长编码的方式称为差值编码。 第6章 多媒体数据压缩技术 6.2.3常用的有损压缩方法(熵压缩) 1.差值编码 (1)视频信号的空间(帧内)相关性的统计分析 ①视频图的组成: “像块”、“轮廓”和“细节” “像块”--是图像中成片相同像素组成的块,它的空间相关性最强。 “轮廓”---是像块间的分界,它的相关性较差。 ”细节”---是图像中变化最频繁的细节描述,相关性最小。 ②统计结果: “像块”要占约90%以上; “轮廓”和“细节”只占不到10%。 (2)时间(帧间)相关性的分析 ①在静止画面中,其帧间相同位置的样值则100%的相同。 ②在非静止画面中,相邻帧的不同部分也只是运动物体,只占较小的比例 第6章 多媒体数据压缩技术 差值编码原理图 ) 1 ( ) ( ) ( - - = D n i n i n i V V V ΔVi’(n)=ΔVi(n)+ε(n) V o(n)= V o(n-1)+ ΔV i(n)+ε(n) 第6章 多媒体数据压缩技术 ● 2.差分脉冲编码调制(DPCM) 预测编码 如图所示:设Xn为实际样值,X^n为其预测值 A:本行前一样值 B:上一行前一样值 C:上一行该点样值 D:前一帧该点样值 预测值X^n应为: X^n=F(A,B,C,D) 三维预测 第6章 多媒体数据压缩技术 预测编码 (2)线性预测 上式应为:X^n= KaA+KbB+KcC+KdD 其中Ka、Kb、Kc、Kd分别为A、B、C、D的权重或系数。 一般有 : Ka+Kb+Kc+Kd=1 讨论: ①当Kb=Kc=Kd=0,Ka=1时, ②当Ka+Kb+Kc=1,Kd=0时, ③当Kd≠0为三维预测, 为一维差值预测。 为二维预测,即帧内预测。 即帧间预测。 发送端:ΔXn= Xn- X^n 第6章 多媒体数据压缩技术 ● 3.变换编码 离散余弦变换 1.离散余弦变换(DCT) (1)视频图像的频率特征:低频信号的幅值大,高频信号幅值小。图像信号的能量主要集中于信号的低频分量,而高频分量的能量较小。 (2)相关性分析:对于变化复杂的图像来说位置空间的相关性并不明显。 (3)DCT变换的方法 ①分块:将每个分量图像分成许多8×8=64个样点组成的像块,并对其采样,得到在空域中的8×8的样值矩阵。 ②变换:利用FDCT公式,将空域中的8×8样值矩阵,正向变换 (FDCT)为频域中的8×8 DCT系数矩阵。 第6章 多媒体数据压缩技术 FDCT变换 如图示: 低频 高频 第6章 多媒体数据压缩技术 a:两个空间的同位置系数无对应关系。 b:在频域中的右下角对应高频部分,而在左上角对应低频部分 c:DC系数的构成: d:DCT系数的取值范围:在视频数字化中,由于采用8位量化,在空域中的样值的最大值应为256,所以 F(0,0)MAX=DCMAX=256×64/8=2048 故:0≤DC≤2047 AC的取值范围:

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档