第6章多媒体数据压缩技术.ppt

下载文档 降价啦

1
0
约1.18万字
约 61页
2017-06-24 发布于湖北
举报
版权申诉
保障服务

第6章多媒体数据压缩技术.ppt

1、本文档共61页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

3.Zig-Zag扫描：一种将二维数组转变为一维数组的Z字形扫描方法。 (1)Zig-Zag扫描的依据：在量化后的DCT系数矩阵中，非0的数据主要都集中于矩阵的左上角。 ①分片：将图像分割成许多横向条(或称“片”)，每条的宽度为16个采样点。 ④宏块的形成：由4个8×8的亮度(Y)像块组成的宏区块和与之重叠的两个8×8的色差(U，V )像块，这6个像块组成一个宏块。如图： 2.FDCT变换由f(x，y),变换为8×8=64个FDCT系数F(u,v)。 3.量化（区域滤波法） 4.差值编码与Zig-Zag扫描后行程编码 5.熵编码并输出数据流 5.熵编码并输出数据流 6.2.3常用的有损压缩方法（熵压缩）预测编码：根据原始的离散信号之间存在关联性的特点，利用前面的一个或多个信号对下一个信号进行预测，然后对实际值和预测值的差进行编码。常用的有PCM（脉冲编码调制），拆分脉冲编码调制（DPCM），自适应拆分脉冲编码调制（ADPCM）. 第6章多媒体数据压缩技术 6.2.3常用的有损压缩方法（熵压缩） ● 差分脉冲编码调制（DPCM）差值编码 ● 差分脉冲编码调制原理 ①在发送端:处理或传输的不是图像中当前样值本身，而是该样值与前一个（相邻）样值的差值，则这些差值绝大多数是很小的或为零，可以用短码来表示，而对那些出现几率较少的较大差值，用长码来表示，则可使总体码数下降。 ②在接收端:将已得到的前一样值与刚收到的差值相加，就可还原出所要的当前样值。对相邻的样值差值进行变字长编码的方式称为差值编码。第6章多媒体数据压缩技术 6.2.3常用的有损压缩方法（熵压缩） 1.差值编码 (1)视频信号的空间(帧内)相关性的统计分析 ①视频图的组成: “像块”、“轮廓”和“细节” “像块”--是图像中成片相同像素组成的块，它的空间相关性最强。 “轮廓”---是像块间的分界，它的相关性较差。 ”细节”---是图像中变化最频繁的细节描述，相关性最小。 ②统计结果: “像块”要占约90％以上； “轮廓”和“细节”只占不到10％。（2）时间(帧间)相关性的分析 ①在静止画面中，其帧间相同位置的样值则100％的相同。 ②在非静止画面中，相邻帧的不同部分也只是运动物体，只占较小的比例第6章多媒体数据压缩技术差值编码原理图 ) 1 ( ) ( ) ( - - = D n i n i n i V V V ΔVi’(n)=ΔVi(n)+ε(n) V o(n)= V o(n-1)+ ΔV i(n)+ε(n) 第6章多媒体数据压缩技术 ● 2.差分脉冲编码调制（DPCM）预测编码如图所示：设Xn为实际样值，X^n为其预测值 A：本行前一样值 B：上一行前一样值 C：上一行该点样值 D：前一帧该点样值预测值X^n应为： X^n=F（A，B，C，D）三维预测第6章多媒体数据压缩技术预测编码（2）线性预测上式应为：X^n= KaA+KbB+KcC+KdD 其中Ka、Kb、Kc、Kd分别为A、B、C、D的权重或系数。一般有： Ka+Kb+Kc+Kd=1 讨论： ①当Kb=Kc=Kd=0，Ka=1时， ②当Ka+Kb+Kc=1，Kd=0时， ③当Kd≠0为三维预测，为一维差值预测。为二维预测，即帧内预测。即帧间预测。发送端：ΔXn= Xn- X^n 第6章多媒体数据压缩技术 ● 3.变换编码离散余弦变换 1.离散余弦变换（DCT） (1)视频图像的频率特征：低频信号的幅值大，高频信号幅值小。图像信号的能量主要集中于信号的低频分量,而高频分量的能量较小。 (2)相关性分析：对于变化复杂的图像来说位置空间的相关性并不明显。 (3)DCT变换的方法 ①分块：将每个分量图像分成许多8×8=64个样点组成的像块，并对其采样，得到在空域中的8×8的样值矩阵。 ②变换：利用FDCT公式，将空域中的8×8样值矩阵，正向变换（FDCT）为频域中的8×8 DCT系数矩阵。第6章多媒体数据压缩技术 FDCT变换如图示：低频高频第6章多媒体数据压缩技术 a:两个空间的同位置系数无对应关系。 b:在频域中的右下角对应高频部分，而在左上角对应低频部分 c:DC系数的构成： d:DCT系数的取值范围：在视频数字化中，由于采用8位量化，在空域中的样值的最大值应为256，所以 F（0，0）MAX=DCMAX=256×64/8=2048 故：0≤DC≤2047 AC的取值范围：