- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
EBMA算法实现与运动矢量场量化
作业三
EBMA算法实现与运动矢量场量化
一、实验内容
用Matlab实现EBMA算法,计算运动补偿误差;对所求得的运动场用矢量量化方法进行编码,码书大小可自己指定。
二、实验背景
运动估计是现阶段所有视频编码相关的国际标准中的关键技术。运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。利用得到的运动矢量在帧间进行运动补偿。补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。运动估计作为视频编码的关键技术,需要解决的问题是如何提高它的估算速度和精度。
运动估计法主要分两大类:像素递推法和块匹配法。运动估计算法中,块匹配算法因具有简单、实用的特点而得到广泛应用。
全搜索算法是简单也是效果最好的一种匹配算法,通过的全搜素匹配得到的结果是全局最优的,但由于计算量很大,我们在编解码中往往不采用这种方法,而只把他作为与其他算法的一种比较。为了兼顾估算精度和运算速度,我们提出了一系列的快速算法。快速算法通过限制搜索位置的数目来减小计算复杂度,但不利于估计小的运动且搜索容易陷入局部最优。目前存在的快速运动估计算法中,早期的三步法(TSS)和二维对数法(TDL)、新三步法(NTSS)、四步法(FSS)、基于菱形的搜索算法(DS)和基于六边形的搜索算法(HEXBS)等。
三、实验原理
(一)、全搜索运动估计
块匹配运动估计把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,这个相对位置称为运动矢量而参考块和匹配块的差称为残差因此在视频编码时不需要对整幅图像进行处理而只需要对运动矢量和残差进行编码这样就可以在解码端恢复参考块的图像从而达到了压缩的目的。如下图所示,假设图像中每块的大小为M×N,dxmax为参考块水平方向可搜索最大位移而dymax为参考块垂直方向可搜索最大位移那么基于块匹配的运动估计就是在参考帧(或者其它上一帧)的(M+2dxmax)×(N+2dymax)候选区搜索窗口中找到和目标帧的当前大小为M×N的块的最匹配的块则参考块的运动矢量可用如下的数学公式描述:
R 表示相关性评价函数,f(m,n)表示目标或当前帧图像的灰度值。满足R为最大时的X、Y为运动矢量,用MV表示。
块匹配估计准则是判断块相似程度的依据,因此匹配准则的好坏直接影响了运动估计的精度;另一方面,匹配运算复杂度、数据读取复杂度和内存管理复杂度在很大程度上取决于所采用的块匹配准则。我们这里用到的块匹配准则是:
平均绝对误差函数(Mean of Absolute Error, MAE)
有些文献中MAD演变为绝对差和:
在上述匹配准则中,由于SAD只采用了加法和绝对值计算,便于计算和硬件实现而且它的匹配精度与MAD相差不大。
此外搜索精度还与块的大小、搜索窗的大小、搜索步长有关。
(二)、运动矢量场的量化编码
运动估计所得到的每个运动矢量包含两个分量,包括水平分量x和垂直分量y。每个锚定帧所产生的所有运动矢量构成运动矢量场,利用矢量量化方法,可以对运动矢量场进行矢量量化,其中量化维数为2,由水平分量和垂直分量组成。我们用每一场中的所有运动矢量来训练矢量量化的码书,以达到比较优化的量化效果即总体失真较小。
在具体量化运动矢量场时,我们可以将每个运动矢量的想x,y分量看成是二维空间上的一个矢量,由此我们可以将运动矢量场的量化问题抽象为二维空间的分割为个区域,并由具有代表性的点来表示区域中的所有点。我们将称为分割区域,称为重建矢量或码字,包含所有码字的集合称为码书,量化函数可以描述为:
一般的,一个矢量量化器由码字和分割区域确定。使用最近邻量化器,对于任何输入矢量,通过将此矢量与所有的码字相比较,并且在距离测度条件下寻找与它最接近的一个来确定量化矢量。分割区域可以通过下面的公式确定:
也最简单的VQ量化器是均匀点阵量化器,所有的分割区域具有相同的形状和大小,但是当信源不是均匀分布时,它可能不是最有效的。对于一个给定的N维矢量和信源概率密度函数,希望设计出一种最佳量化器,对于给定的码书大小L,使得给定的失真准则最小化。理想情况下,应当同时确定码字和分割区域使得平均失真最小,然而最优解难以找到。可以使用替代的方法,首先对给定的码字,分割区域应该使所有区域上平均失真最小,其次对于给定的分割区域,码字的选择应当使该区域内的失真最小。
在运动矢量场2维矢量量化实验过程中分别使用了256大小的码书,并且使用重构后的运动矢量场应用于预测图像的重构,并比较重构图像与原始图像的PSNR值。
四、实验步骤
具体
原创力文档


文档评论(0)