数字视频压缩编码要点.pptVIP

下载本文档

7
0
约1.08万字
约 76页
2016-04-10 发布于湖北
举报
版权申诉

数字视频压缩编码要点.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数字视频压缩编码数据压缩的必要性庞大的数据量要求人们必须对数据进行压缩例：存储一幅352×288的静态真彩色图像需要的存储空间： 352×288×3B=304.13kB 真彩色色彩深度24bit，即3个字节例：计算1分钟视频所需的存储空间。分辨率为352×288，每秒25帧，不含音频数据 304.13kB×25×60=456195kB=445.5MB 数据压缩的可能性能够对多媒体信息进行压缩的前提就是因为数据中存在大量的冗余，尤其是声音和图像；数据压缩的目的就是尽可能的消除这些冗余；冗余的类型在静态图像中存在空间冗余一幅图像中有较大的背景区域，在此区域中所有的点具有相近的物理特性（亮度、颜色等），这种空间的连贯性就称为空间相关或空间冗余。在视频序列中存在时间冗余视频序列中相邻的帧往往包含相同或类似的背景和运动物体，只不过运动物体所在的空间位置略有不同。这种相邻帧间数据的高度相关性就称为时间冗余。冗余的类型信息熵冗余信息熵冗余也称为编码冗余，由香农定理可知，为表示图像数据的一个像素点，只要按其熵的大小分配相应的比特数即可。而对于实际图像数据的每个像素，在图像获取时很难得到它的熵，因此，一般是对每个像素采用相同的比特数来表示，这样就必然存在冗余，这种冗余称为信息熵冗余。冗余的类型视觉冗余人眼的视觉特性知识冗余先验知识和背景知识结构冗余指视频图像中存在很强的纹理结构或自相似性去除冗余的方法空间冗余的消除基于预测的方法：帧内预测正交变换的方法时间冗余的消除基于预测的方法：帧间预测编码冗余的消除熵编码数据压缩的方法无损压缩压缩时不损失任何信息，解压时可以完全恢复成原来的数据；利用原始信息中的相关性进行的数据压缩不损失原信息的内容，可实现无损压缩统计式：Huffman编码、算术编码（AC）、行程编码（RLC)；字典编码（LZW）数据压缩的方法有损压缩：数据压缩后不能将原来的文件信息完全保留的压缩；在很多情况下，数据压缩还原过后允许有一定的损失，不过应当能基本表述原信息的内容，否则没有意义；依据：在原始信息中存在一些对用户来说不重要、不敏感、可以忽略的内容； JPEG、MPEG 图像压缩方法视频编码技术主流的编码技术是以宏块为单位进行编码，将每帧图像划分成若干宏块，按照从上到下，从左到右的顺序对每个宏块进行处理。预测编码预测编码是消除视频冗余的重要编码工具之一，针对空间冗余有帧内预测编码（intra-prediction），对于时域冗余有基于运动估计技术的帧间预测编码（inter-prediction）。预测编码利用信号间的相关性，用前面一个或多个信号作为当前信号的预测值，对当前信号的实际值与预测值之差进行编码。帧内预测编码帧内预测利用图像在空间上相邻像素之间具有相关性的特点，由相邻像素预测当前块的像素值，可以有效的去除块间冗余。帧内预测包含多个预测方向，按照图像本身的特点选择一个最佳的预测方向，最大限度地去除空间冗余。帧内预测编码 DPCM系统的基本原理 DPCM(Differential Pulse Code Modulation，差分脉冲编码调制) 帧内预测编码 DPCM系统的基本原理接收端恢复的输出信号和发送端输入的信号的误差是可见，输入输出信号之间的误差主要是由量化器引起的。帧内预测编码预测模型设时刻之前的样本值，，…，与预测值之间的关系呈现某种函数形式线性预测编码器非线性预测编码器帧内预测编码在图像数据压缩中，常用如下几种线性预测方案：前值预测，即一维预测，即采用同一扫描行中前面已知的若干个样值来预测二维预测，即不但用同一扫描行中的前面几个样值，而且还要用以前几行扫描行中样值来预测举例如下帧间预测编码运动图像邻近帧中的场景存在着一定的相关性，因此，可为当前块搜索出在邻近参考帧中最相似的预测块，并根据预测块的位置，得出两者之间的空间位置的相对偏移量，即运动矢量。通过搜索得到运动矢量的过程称为运动估计。根据运动矢量，从指定的参考帧中找到预测块的过程称为运动补偿。帧间预测编码中的运动补偿最简单的时域预测就是用前一帧作为当前帧的预测参考帧。一个视频序列里两个相邻帧如右图所示。第一帧作为第二帧的参考帧，残差是第二帧与参考帧之差。帧间预测编码中的运动补偿在右图中，中间灰度代表差值为零，浅灰和深灰分别对应正、负差值。这种简单预测的明显问题是残差帧