- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HEVC视频编码技术的研究与实现.ppt
测试模型中对每一种尺寸的变换块都统一采用Chen快速DCT算法,这个不是最快的算法,但是该算法具有很强的通用性。 loeffler等人提出的快速算法只需要11次乘法运算,这个值已经达到理论的极限最小值,同时加法的次数没有明显增加,该算法可以有效地提高运算速度。 改进后的16点DCT/IDCT快速变换,性能提升在4%左右。 Thanks HEVC视频编码技术的研究与实现 专业:通信与信息系统 姓名:杨克伟 学号:23320111153156 视频编码标准的发展 目前国际电信联盟ITU-T的视频专家组VCEG和国际化标准组织ISO/IEC的运动专家组MPEG是两大主要的标准化组织,他们基于不同的应用需求,分别制定了H.26X和MPEG-X系列的视频压缩标准。 H.26X系列的视频标准主要应用在实时的视频通信系统;MPEG-X系列的标准则应用于数字监控系统、视频存储、广播电视及因特网等领域。 2001年12月MPEG和VCEG又成立视频联合工作组JVT制定视频编码标准H.264/AVC(MPEG-4第10部分),结合多种先进的视频编码技术获得比以往各种标准更优越的编码性能。 HEVC(High Efficiency Video Coding)是两大组织成立的联合小组JCTVC正在研究的下一代新的视频压缩编码方案,主要针对高清和超高清的视频图像,HEVC目标在H.264/AVC high profile的基础上,对高分辨率/高保真的视频图像压缩效率提高一倍,也就是在保证相同视频图像质量的前提下,视频流的码率减少50%。 HEVC主要是在原H.264/AVC的编码框架上,提出更先进的改进技术,包括扩展的编码单元尺寸、基于块的更灵活的帧间/帧内预测方式、大尺寸块的变换、新的熵编码方法、更加复杂的内插滤波器等。 HEVC主要特征 HEVC新视频编码方案依然沿用MPEGX和H.26X系列采用的混合编码框架。 帧间和帧内预测编码:消除时间域和空间域的相关性。变换编码:对残差进行变换编码以消除空间相关性 。熵编码:消除统计上的冗余度。 HEVC将在混合编码框架内,着力研究新的编码工具或技术,提高视频压缩效率,相较于以往的视频编码技术,将会有更多的优越性: (1)压缩效率更高 (2)视频质量更高 (3)健壮性更好 (4)对IP网络的友好性好 HEVC编码器 HEVC帧内预测的优化 一帧视频图像由许多的像素点组成,大量的统计数据表明,两个像素的空间距离越近相关性越强,即邻近像素值发生突变的概率很小。当前像素可以由邻近的像素的加权和作为预测值,按与当前像素的距离不同给以不同的权值。邻近的用来预测的像素成为参考像素。在传输中,只传送实际象素值X与预测值P的差值信号R,邻近像素间的相关性强差值R很小,从而达到压缩编码的目的。接收端把差值R与预测值P相加即可恢复原始的像素值X,整个过程可以归纳如下: 编码端:X-P=R 解码端:P+R=X 这种基于空间相关性的压缩方式称为帧内预测编码。 在对预测单元的尺寸的选择上,需要从4×4到64×64各种大小的尺寸都搜索一遍。而对于平坦的区域预测单元一般会选大的分割尺寸,而对于多细节的区域多选择小尺寸的分割,对于这样特殊的情况把所有的尺寸都搜索一遍会浪费很多时间,因此在进行帧内预测之前,先对预测单元的复杂度进行估计,选定某几种预测单元的尺寸,这对现有的选择方法会有很大改进。最小平均绝对误差(MAD)可以被用来估计块的纹理复杂度,MAD的计算可以由下面的公式得来: 其中P(x,y)代表当前预测单元中像素点所在位置,m代表该预测单元所有像素的均值,ABS表示取绝对值,2N×2N表示当前最大编码单元LCU的尺寸,这里最大编码单元设置为64×64。用MAD来表示一个预测单元的复杂度,如果平坦则该值相对小,如果纹理细节较丰富那么该值相对大,现在需要找到一个恰当的阈值作为分割点,降低搜索树的深度,减小搜索的范围从而降低复杂度。 为了找到一个合适的阈值,对6个序列进行测试,测试序列分别为BQTerrace (1920×1080)、ParkScene(1920×1080)、vidyo3(720p)、BasketballDrill(832×480)、BQMall(832×480)、ParkScene(832×480),对前两个序列取前80帧全I帧,后面三个序列取前100帧全I帧。序列的纹理复杂度和大小分辨率各有差别,对每个序列在不同QP条件下进行测试。表3-1是测试的结果,MAD是按公式(3-8)以LCU为64×64计算的。表中的数据以64×64预测单元为例,第三列的的数据表示当预测单元的分割模式为64×64时,该预测单元所属的LCU的MAD值大于50的概率。统计结果表明,当分割模式为64×64时,其所属的LCU的MAD值绝大部分小于3
文档评论(0)