新·第7讲-运动图像的编码(一)-精.pptVIP

下载本文档

30
0
约4.32千字
约 32页
2017-01-14 发布于湖北
举报
版权申诉

新·第7讲-运动图像的编码(一)-精.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

运动图像的编码（一）运动图像的特点运动图像编码中的几项技术运动矢量估计：块匹配法，像素递归法帧间预测编码帧间内插运动图像编码系统典型的编码器框图速率控制的反馈编码速率的范围运动图像的特点运动图像本质上是连续的时间内连续的场景变化，我们眼睛看到的实际事物就满足这个要求。由于人眼的视觉特点，我们可以利用离散的时间点上一幅幅图像来表示，而让人产生同样的视觉效果。这一幅幅图像就是帧，就是时间离散化的结果。在一帧图像中，我们可以从空间上分割为一个个像素，用单个像素来替代原来的若干模拟点，这就是空间离散化的结果。我们对于运动图像，就利用时间离散化和空间离散化产生的相关性，来进行压缩编码运动图像的冗余空间冗余：和静止图像的冗余情况一致时间冗余：人眼的视觉特点，25fps就可以认为连续。帧间预测：利用相邻帧的时间相关性运动估值：对运动的物体，帧间的相关性降低，利用运动估值，可以减小预测的残差。运动图像编码技术我们已经讲过了静止图像编码，运动图像既然是一幅幅静止图像在时间上的先后排列，因此可以简单的将每一幅静止图像编码组合起来，就形成了一个运动图像的编码。这样的码流还是很大，举例来说，一幅300*200的图像，用JPEG压缩后要20K Bytes。如果是30帧/秒的视频，则会产生600KB/s=4.8Mb/s的码流。这在网络传输中还是无法接收的带宽要求。为此，我们必须利用运动图像在时间轴上的相关性，利用预测编码的方法，而只传输余量信号，就可以减小信号的动态范围，降低码率。进行准确预测的基础就是运动矢量估计，具体的编码方法就是帧间预测编码运动矢量估计块匹配方法(1) 按一般想法，应将运动物体和静止背景分离，然后再对运动物理进行运动估计。如何分离？实际上，将图像分块，并认为每块内像素具有同样的运动矢量。在k帧中的一个块，在k-1帧中寻找最相似的子块，称为匹配块，进而得到运动矢量D 块匹配方法(2) 块匹配方法(3) NCCF计算复杂，常用下面两个计算简单的值。帧间子块亮度的均方差值MSE 帧间子块亮度的绝对值的均值MAD 匹配块的搜索全搜索：在整个搜索区域逐个像素移动，每次都要计算MAD。总的移动次数：快速搜索算法二维对数法三步法共轭方向法正交搜索法基于同一假设：当偏离最小误差方向时，判决函数单调上升。即不存在局部最小值。三步法每步对中心和8个临域点计算，而且临域点和中心点的距离，随着搜索步骤的增加而减小。右图搜索3步，最终的匹配点是(i+2,j+6) 共轭方向法首先延水平方向搜索，计算中心点与左右两点的判决值，找到最小点，并移动，直到中心点就是最小点。再延垂直方向进行搜索，直至找到最佳匹配点。快速搜索算法比较像素递归法(1) 先将图像中的运动部分与静止部分分开，然后在运动区域内每个像素上以迭代的方式计算位移量像素递归法(2) 两种方法的比较块匹配法不需要分离运动与静止区域一个块有一个运动矢量像素递归法需要分离运动与静止区域逐个像素，或者逐个独立运动的模块进行递归运动矢量估计更准确对于一般的运动图像，由于运动物体无规律，采用块匹配法更合适；而对于那种大面积背景不变，而只是单个或个别物体运动的运动图像，则更适合用像素递归法。半像素搜索为了提高运动矢量的精度，引入半像素搜索。在原先搜索到最小MAD的位置(i,j)上，再通过线形内插得到周围8个半像素点。再在这9个点中寻找最终的匹配点。具有运动补偿的帧间预测前向预测(1) 前向预测：用k-1帧来预测k帧。不直接传送当前帧像素，而是传送同一位置的当前帧像素与前一帧像素的差值。对运动物体，这个差值很大，预测没有起作用。如果已知运动物体的方向和速度，可从k-1帧的位置推出k帧中运动物体的位置，而背景而以k-1帧的背景代替。这种方法称为具有运动补偿的帧间预测。前向预测(2) 基本步骤将图像分割为运动物理和静止背景，估计各运动物体的运动矢量。计算运动补偿后的预测值传送预测误差，运动矢量以及对运动物体和静止背景的分割的信息。事实上，将图像分割为静止区和不同的运动区域，是很困难的。一般来说，将图像分块，每块都作为一个物体估算运动矢量，接收端按上面的方法可以恢复该块数据。前向预测(3) 问题：若同一块中有两个不同的运动物体，则运动矢量必然不准确，导致预测误差增大。 k-1与k帧中各子块的相互关系后向预测与双向预测如果用k帧预测k-1帧的图像，称为后向预测为提高压缩比，往往需要用前后两帧来预测中间帧，称为双向预测。利用两个运动矢量和预测值，进一步降低预测误差。问题：会引入延时。具有运动补偿的帧间内插帧间内插(1) 在发送端每隔一段时间，丢掉一帧或几帧图像，在收端利用帧间相关性将丢掉的帧