- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
H.264 中一种改进的基于结构相似性的
运动估计方法
张士君
北京邮电大学电信工程学院,北京(100876)
E-mail :sjzhang826@
摘 要:在 H.264 的运动估计中,我们通过Lagrange 代价函数来选择最佳匹配块和最佳预测
模式。而 Lagrange 代价函数中的失真矩阵是绝对误差和(SAD),它与均方误差(MSE )或
者峰值信噪比(PSNR )有着类似的含义。人们提出了一种被称为结构相似性(SSIM )的图
像测量法。实践证明,对于被感知的图像失真,SSIM 可以提供一种比目前广泛使用的 PSNR
或者 MSE 更好的近似。本文介绍了一种改进的基于 SSIM 的运动估计方法,将此方法用于
H.264 的帧间编码中。实验结果显示,在保持相同主观图像质量的情况下,这种改进的基于
结构相似性的运动估计法(MEBSS )可以平均减少20% 的比特率和2% 的编码时间,其中最
多可以减少超过 50%的比特率。
关键词:H.264 ,帧间预测,结构相似性,运动估计
1. 引言
H.264 是由ITU-T和ISO/IEC共同制定的新的视频编码标准,它具有高效的压缩性能和易
于网络传输的能力。[1] H.264 采用了可变块尺寸和 1/4 象素精度的运动补偿、多参考帧预测
以及其它先进的方法,可以实现比以往的视频编码标准更高的编码效率。
在混合编码中,运动估计是消除连续帧之间时间冗余最重要的部分,但同时也付出了很
高的计算复杂度作为代价。Lagrange 代价函数用来作为 H.264 运动估计中的匹配矩阵。其中
的 SAD 与 MSE 或者 PSNR 值有着类似的含义。虽然 MSE 和 PSNR 由于它们的低复杂度和
清晰的物理意义目前被广泛使用,但由于它们与人眼视觉系统(HVS )毫无关系,还是作为
缺点被广泛指出。在过去的几十年中,人们努力尝试发展一种新的基于 HVS 误差灵敏度理
论的图像质量评估的方法,但由于 HVS 非常的复杂并且对其没有充分的理解,使得这种发
展具有很大的局限性。
近来人们提出了一种新的图像质量测量的原理,这种原理假设人眼视觉系统非常好的提
取来自所观察区域的结构信息。也就是说,结构信息变化的测量可以提供一个与所感知的图
像失真很好的近似。在这个原理中,引入结构相似性(SSIM )索引来测量结构信息的变化。
实验结果显示,SSIM 索引的方法很容易被实现,并且比 PSNR 和 MSE 更符合人的感知测
量。基于上述的分析,本文介绍了一种改进的基于结构相似性的运动估计方法(MEBSS )。
2.H.264的 P 帧编码和 SSIM
2 .1 H.264 的 P 帧编码
在 H.264 的 P 帧编码中,每幅图像被分割成固定尺寸的宏块(MB ),每个宏块包括视
频帧中的一个 16×16 大小的编码数据(16×16 的亮度样值,8 ×8 的Cb 和 8 ×8 的Cr 样值)。
每个宏块利用先前已编码的数据进行运动补偿预测,预测后的残差数据经过变换、量化和熵
编码,与用于表示预测模式的相关信息一起被传输。每个宏块中的亮度分量(16×16 样值)
可用四种方式进行分裂,并以 1 个 16×16、2 个 16×8、2 个 8 ×16 或 4 个 8 ×8 方式进行运
动补偿。如果选择了 8 ×8 模式,宏块中的 4 个 8 ×8 亚宏块还可分别采用 4 种方式进一步分
裂为 1 个 8 ×8 亚宏块、2 个 4 ×8 亚宏块、2 个 8 ×4 亚宏块或 4 个 4 ×4 亚宏块。另外,采
用 1/4 象素精度运动补偿来提高运动估计的精确性。
块匹配运动估计在一个确定的搜索范围内从参考帧中寻找最佳匹配块。下面的 Lagrange
- 1 -
代价函数用来作为匹配矩阵:
M COST (s, c) SA(T )D(s, c) +λMOTION Bit(ΔMV )
文档评论(0)