- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 数字视音频压缩编码
7.1 数字视频压缩编码基础 7.1.1压缩编码概论 ????? 由于电视信号数字化后码率太高,必须先对数据进行压缩编码,然后再进行存储和传输。压缩编码的主要任务,就是要在人眼不能察觉有失真条件下,尽可能采用比 较简单有效的编码方法,降低码率。 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。1)图像信号的冗余度 为了提出有效的数据压缩方法,首先必修搞清楚图像数据中存在哪些冗余。 空间冗余:在同一幅图像中规则的物体和规则的背景都具有很强的相关性,称之为空间冗余。 时间冗余:在图像序列中的两幅相邻的图像之间有较大的相关性,称之为时间冗余。 ?? 结构冗余:有些图像从大域上看存在着非常强的纹理结构。 视觉冗余:图像最终是由人观看的,人眼的视觉特性是图像压缩编码的另一个重要根据。人眼的视觉系统对于图像的注意是非均匀和非线性 的,图像的编码和解码处理尽管引入了噪声使图像发生了变化,但这些变化如果不一定被视觉所查觉,称之为视觉冗余。2) 数据压缩编码方法的分类根据解码后的数据与原始数据是否完全相同来进行分类,可分为两类: 无损压缩:这种方法解码后的图像与原始图像严格相同,即压缩是完全可以恢复的没有误差的。 有损压缩:次种方法解码后的图像与原始图像存在一定的误差,但视觉效果一般是可被接受的。根据压缩方法的原理来分,又大致分为:预测编码(predictive coding)、变换编码(transform coding)、信息熵编码(entropy coding)等。第七章 数字视音频压缩编码
7.1 数字视频压缩编码基础 7.1.2 预测编码 预测编码主要是减少数据在时间和空间上的相关性,根据某一模型利用过去的样值对当前样值进行预测,然后将当前样值的实际数值与预测值相减得到一个差值,只 对这一预测误差值进行编码。如果预测模型足够好,且样值序列在时间轴上有较强的相关性,预测误差信号则比原始信号小的多,再用通过适当的量化器和编码器将 会使数据量大幅度减少。 1) 差分脉冲编码调制(DPCM)基本原理在编码端,预测器的作用是利用当前时刻n之前的相邻样值x1,x2,… ,xn-1对当前时刻输入的信号样值xn作预测. 预测误差为:量化后的预测误差信号为Q(en);编码器对预测误差信号Q(en)用进行编码以便于传输。
2) 预测器的设计 预测器的预测精度越高,误差信号en就越小,编码后的码率就会越低。按预测值选用的相邻像素不同,预测器可分为帧内预测和帧间预测
(点击查看大图)
3) 帧内预测 帧内预测是根据已经传送的同一帧内的像素来预测当前像素,又可分为:前值预测--用同一扫描行中最相邻的前一个亮度信号的样值来预测
预测器电路框图(点击查看大图)
4) 帧间预测: 帧间预测又称为三维预测是用前一帧的像素来预测当前像素。这种预测器需要使用大容量的帧存储器来存储前一帧的图像。 5) 预测误差的统计特性 由于图像信号的帧内和帧间存在着高度相关性,预测误差en的概率分布高度集中在0附近,如图所示。
(点击查看大图)
6) 量化器设计 在预测编码中根据人眼的视觉特性采用非均匀量化。因为绝对值小的en主要出现在图像的平坦区,所以给以细量化;大的en主 要出现在图像亮度的突变区,给以粗量化。7.1 数字视频压缩编码基础 7.1.3正交变换编码 正交变换编码的基本思想是将图像信号变换到变换域进行描写。然后再根据图像在变换域中系数的特点和人眼的视觉特性进行适当量化编码。正交变换编码也有变 换、量化、编码三大过程。 在图像处理中,正交变换编码有很多类型,在数字电视和多媒体领域中得到广泛应用的 是离散余弦变换压缩编码(DCT)。 1)二维DCT变换公式对于一个N×N图像f(x,y)的二维DCT定义为:正变换
?????????? (7-12)
反变换
?????????? (7-13)
其中 u,v =0,1,…..,N-1 ;x,y =0,1,…..,N-1
2)变换举例一个8×8图像块f(x,y)的DCT变换系数F(u,v)如图7-10所示。其中变量u代表了f(x,y)的水平空间频率,v代表了f(x,y)的垂直 空间频率。由图可见,F(u,v)的能量主要集中在低频部分区域, 左上角F(0,0)对应于该像块的平均亮度值,称为直流系数,其余的63个系数称为交流系数。
DCT变换示意图(点击查看)
3)量化器特性在DCT变换中图像信号在变换域里能量主要集中在低频区,根据人眼对图像的低频分量比对高频分量更敏感的视觉特性,可以对变换系数矩阵中的不同变换系数分
原创力文档


文档评论(0)