重点研究了占用最多运算时间的预测部分的优化,给出了.docVIP

重点研究了占用最多运算时间的预测部分的优化,给出了.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要:从硬件实现的角度分析了H.264算法,重点研究了占用最多运算时间的预测部分的优化,给出了对帧内预测、哈达马变换以及运动估计算法的改进,通过简化运算复杂、效率不高的模块以及减少模块间数据相关性等,对硬件进行优化。通过对各种测试序列的仿真,证明改进是有效的。 关键词:H.264 帧内预测 运动估计 运动预测因子 ????????????????????????????? ????H.264[1]最初是由ITU-T起草的,在未来将成为ITU-T和MPEG的联合标准。H.264因为提供了很高的编码压缩效率、友好的面向网络的接口,将成为下一代新的视频编码标准。但是编码效率很高的同时,其算法的复杂度也提高了四倍,这在很大程序上限制了它的实现。因此,必须针对硬件的实现做改进和优化。 ????????????????????????????? ????H.264的最初测试模型(JM)[2]是为了取得高的编码效果而设计的。在这个测试模型中,有很多的算法需要很大的运算量,但是编码效率的提高却不多,并且很多模拟之间是数据相关的,这一点限制了用并行处理加速硬件的实现。 ???????????????????????????? ????以前有文章分析过这种新的视频编码的复杂度[3~5]。但是这些研究都是通过软件的分析得到H.264算法的复杂度的。这些结果对在软件中的应用是精确的,但是当涉及硬件设计的并行处理时,就不再适用了。 ????????????????????????????? ????经过试验比较可以得出,在H.264硬件实现上的关键点是预测部分,因为此模块所占的计算时间几乎是总时间的90%。所以改进的重点在预测部分。 ????????????????????????????????????????????????????? ????图1是关于一帧图像的帧内预测间预测的算法框图。如果采用帧内预测,帧间预测部分将不进行判断。在进行帧间预测时,会使用多帧预测和可变块大小的运动估计。编码模式选择部分在所有的预测模式中选择一个最佳的预测模式。预测之后用原始的输入帧和预测帧相减,得到残差数据块。对于亮度残差块做4×4整数DCT变换,对于色度残差块的DC系数则进行2×2的整数DCT变换。对变换后的系数做扫描和量化处理后,再对量化后的系数进行熵编码,最终成为输出的码流。编码模式通过模式表,也会输入到熵编码器中。重建的循环过程包括反量化、反DCT变换和反块滤波。最后,将重建帧写入到帧缓冲器中,准备在以后运动估计中使用。 ????因为在空间预测和时间预测上几乎花费了所有的计算能力,所以在JM 4.0上的算法改进主要是在这两部分上。在实现过程中,这两部分通过硬件实现,所以要针对硬件进行优化。 ?????实现编码器所用的硬件系统是基于宏块,也就是说编码器是对一个个连续的宏块进行操作。整个编码系统可以看作一个宏块的流水线,所以有可能在开始编码下一个宏块时,上一个宏块重建过程不定期没有完成,这就影响了流水线的进行。很多基于宏块的商业编码器正是采用这种硬件实现模式,所以处理好这个问题至关重要。 ? 2、帧内预测 ????图1中的编码方框图与H.261、H.263和MPEG-4中的相似。H.264中包含了4×4和16×16两种帧内预测部分。帧内预测需要图像重建的像素值才能实现。在一个典型的基于宏块的系统中,只有在完成整个编码程序后,重建的像素值才能得到。这种数据之间的相关性,会给硬件的实现带来很大的困难。 ??????????????????????? ? ????????????????????????????? ??? 图2描述了4×4块帧内预测中数据的相关性。从a到p的像素值是从A到N及Q的像素值预测出来的。用大写字母表示重建的像素值。因为一个宏块由16个4×4的块组成,所以当前块没有完成编码之前是不能得到重建的像素值的。在JM中用了双通道算法实现这些块的编码。为了做一个4×4块的预测,在JM中需要进行变换、量化、反变换到反量化的过程。这对于一个硬件来说太复杂了。在现有的硬件水平上是不可能实现的。 ????对这一点,需要对算法做如下改进:所有预测中所有的重建帧像素值用输入帧的原始值代替。通过这样的改进,4×4的帧内预测和变换可以在宏块的流水线上顺利地实现。 2.2 16×16帧内预测 ???? ????图3给出了16×16帧内预测的数据相关性。当前宏块的预测是基于重建帧中位于当前宏块位置上方的17个像素和左侧的16个像素的。因为对当前宏块进行预测时左边宏块的重建可能并未完全完成,当用到当前宏块位置左侧的那些像素时就用原始像素代替。 ? 2.3 编码模式选择 ???? ????按照前面所给出的改进算法,如果只是简单地用原始像素代替重建像素的话会造成编码模

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档