H.265的关键压缩技术和应用展望.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
H.265的关键压缩技术和应用展望   中图分类号: TB652 文献标识码: A 文章编号:   一、H.265的发展背景   H.264自发布以来,以其高效的压缩效率,良好的网络亲和性以及优越的稳健性等优点迅速得到了广大用户的认同。然而,随着终端处理能力以及人们对多媒体体验要求的不断提高,高清、3D、无线移动已经成为视频应用的主流趋势,H.264编码标准的压缩效率仍然不足以应对高清、超高清视频的应用,需要更为高效的编码压缩方案。为此,国际电联组织(ITU-T)和移动视频专家组(MPEG)成立了视频编码联合小组(JointCollaborativeTeamonVideoCoding,JCT-VC)制定了最新的视频编码标准H.265(HEVC),期望在数据传输和码流效率上较之前的编码算法将提高67%。      二、H.265视频压缩编码的关键技术和优化   H.265新视频编码方案依然沿用MPEGX和H.26X系列采用的混合编码框架。在此框架下,H.265进行了大量的技术创新,其中具有代表性的技术方案有:基于大尺寸四叉树块的灵活的分割结构和变换结构,多角度帧内预测技术、自适应环路滤波技等。   2.1 基于四叉树结构的灵活的码分割   为了提高高清、超高清视频的压缩编码效率,H.265提出了超大尺寸的四叉树编码结构,使用编码单元(CU,coding Unit)、预测单元(PU,Prediction Unit)和变化单元(TU,Transform Unit)3个概念来描述整个编码过程(如图1)。          图1编码单元(CU)、预测单元(PU)、变换单元(CU)   其中CU类似于H.264/AVC中的宏块或子宏块,每个CU均为2N×2N的像素块(N为2的幂次方),是H.265编码的基本单元,目前可变范围为64×64至8×8。图像首先以最大编码单元(LCU,如64×64块)为单位进行编码,在LCU内部按照四叉树结构进行子块划分,直至成为最小编码单元(SCU,如8×8块)为止。   对于每个CU,H.265使用PU来实现该CU单元的预测过程,HEVC使用预测单元(PU)来实现该CU单元的预测过程。PU尺寸受限于其所属的CU,可以是方块(如2N×2N,N×N),也可以为矩形(如2N×N,N×2N)。   一种新的不对称运动分割预测(AsymmetricMotionPartition,AMP)方案也已经被JCT所接受,这也是H.265与H.264在分块预测技术中最为不同之处。所谓AMP,即将编码单元分为两个尺寸大小不一致的预测块,其中一个PU单元的宽/长为CU单元的1/4,另一个PU对应的宽/长为CU单元的3/4,如图3所示。这种预测方式考虑了大尺寸可能的纹理分布,可以有效提高大尺寸块的预测效率。   2.2灵活的变换结构   H.265突破了原有的变换尺寸限制,可支持4×4至32×32的编码变换,以变换单元(TU)为基本单元进行变换和量化。为提高大尺寸编码单元的编码效率,DCT变换同样采用四叉树型的变换结构。   配合不对称预测单元以及矩形预测单元,新的HM4.0模型还采纳了相应的矩形四叉树TU结构,突破了方块变换的限制。   测试结果表明,非正方形四叉树更适合矩形PU和AMP变换,可节省大约0.3%的比特,同时增加2%左右的编码复杂度,对解码几乎没有影响。采用大尺寸树形编码结构有利于支持大尺寸图像编码。当感兴趣区域一致时,一个大的CU可以用较少的标识代表整个区域,这比用几个小的块分别标识更合理。其次,任意LUC尺寸可以使编解码器对不同的内容、应用和设备达到最优化。对于目标应用,通过选择合适的LCU尺寸和最大分级深度,使编解码器具有更好的适应能力。   2.3 多角度帧内预测   H.265的帧内预测将原有的8种预测方向扩展至33种,增加了帧内预测的精细度。   2.4 广义B预测技术   在高效预测模式下,H.265仍然采用H.264中的等级B预测方式,同时还增加了广义B(GeneralizedPandBpicture,GPB)预测方式取代低时延应用场景中的P预测方式。GPB预测结构是指对传统P帧采取类似于B帧的双向预测方式进行预测。在这种预测方式下,前向和后向参考列表中的参考图像都必须为当前图像之前的图像,且两者为同一图像。对P帧采取B帧的运动预测方式增加了运动估计的准确度,提高了编码效率,同时也有利于编码流程的统一。   2.5 采样点自适应偏移(Sample Adaptive Offset)   SAO在编解码环路内,位于Deblock之后,通过对重建图像的分类,对每一类图像像素值加减一个偏移,达到减少失真的目的,从而提高压缩率,减少码。采用SAO后,平均可以减少2%

文档评论(0)

sis_lxf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档