网易视频云:视频硬件编码技术对比——QuickSyncvsNVencvsAMDVCE.docx

网易视频云:视频硬件编码技术对比——QuickSyncvsNVencvsAMDVCE.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网易视频云:视频硬件编码技术对比——QuickSyncvsNVencvsAMDVCE剖析

网易视频云:视频硬件编码技术对比——QuickSyncvsNVencvs AMD VCEQuicksync????Intel在 Sandy Bridge 架构 CPU 中引入了的 MFX(Multi-Format Codec Engine,多格式编解码器引擎)视频处理引擎。第一代 MFX 是从 Sandy Bridge 上引入的,现在的 Ivy Bridge 和下一代的 Haswell 也分别具备第二和第三代 MFX, Ivy Bridge 的第二代 MFX 主要是改进了性能,而 Haswell 的第三代 MFX 除了速度比?Ivy Bridge 更快外,在同码率画面品质方面也会有 11% 的改进。MFX 包含了解码器、编码器和视频效果处理器三部分,其中编码器属于二工位混合式的硬件编码器。Intel 将编码器的动作分为两组,即 ENC 和 PAK,其中 ENC 包括了码率控制、运动估算、帧间估算、模式抉择;而 PAK 包括了运动补偿、帧间预测、前向量化、像素重构、熵编码。ENC 操作由 GPU 的可编程 EU 矩阵执行,PAK 则是 MFX 的硬件流水线执行,两组动作对不同的帧同时执行,可以藉此达到最高性能。MFX 令人印象深刻的还有它的解码器性能。例如我们测试的 16 分钟 1080p 片段,在基于 GF110/GF104 的 GTX 580/GTX 560 Ti 上解码性能为 94.2 fps,基于GK104 的 GTX 680 是 158fps,而在 Sandy Bridge/ Ivy Bridge 的 i7-2600K/3770K 上解码性能居然分别高达让人瞪目乍舌的 460fps、606fps。硬件解码性能的强大,除了说明 GPU 能应付更复杂的视频解码外,还意味着可以在转码的时候更多地解放 CPU 负荷。此外,IVB的Quick Sync也统一到了Media SDK API下。?CUDA/NVENC????首先要说明,CUDA Encoder 和 NVENC 是两个不同的东西,前者是采用 GPU 的通用计算单元进行编码加速,后者则是增加了专门的硬线化编码电路作编码加速。在今年发布的 Kepler 家族 GPU 中,NVIDIA 集成了专用的 h.264 硬件编码器——NVENC,这和之前的 CUDA 编码器有很大的不同,因为之前的 CUDA 编码器是由 GPU 的通用计算执行部分 h.264 算法来实现加速。而 NVENC 则主要由专门为 h.264 算法定制的硬件单元来执行编码操作,主要的好处是在进行编码操作的时候性能/耗电比要比 CUDA Encoder 高很多。目前在官网已经提供了有关NVENC 的SDK可以下载,NVIDIA NVENC 能实现 4K 分辨率、支持 h.264 High Profile 4.1、3D 视频流压缩。支持 NVENC 的编码器有有很多软件,例如 Cyberlink 的 Media Espresso 转码器媒体测试专用版。VCEAMD在最新一代的GCN架构中增加了专用的VCE(Video EncodecEnigine)引擎,支持1080P 60fps视频转码,而且支持完整的H.264规范(前一代转码只支持H.264 Baseline),唯一的问题是软件支持度不够好,发布5个多月了才有MediaEspresso支持。?画质对比Hardware.fr用的是PSNR和SSIM数值,PSNR(Peak signal-to-noise ratio,峰值信号噪点比例)是信号强度与噪点强度的比值,可以用来衡量有损压缩编码过程中的失真度。而SSIM(structural similarity index,结构相似指数)也是用来衡量两张图片之间的相似度。上面的计算只是基于平均状况,并不是全部内容,再来看一下500张逐帧截图中的SSIM指数吧。http://www.hardware.fr/marc/h264nvenc/graph.htm?focus_inception720ps1?真实截图对比?http://www.hardware.fr/marc/h264nvenc/imgcompivy.htm?inception720a?原文作出了动态效果,最下面是各种编码方案的画质选择,点击左侧部分,转码后的截图就会出现在网页左边,右边则是另一种方案的画质截图,比如上图中我选择了原图与GTX 670(NVENC)编码,效果就是这个样子。结果是:NVIDIA GPU加速编码的画质损失依然是最严重的,而最新的H.264编码做的比较好,特别是2-pass画质十分接近原始画质。转码速度及功耗  使用的影片是720P分辨率的《阿凡达》,结果如下:?(说下表格的数据,第一列是转码时间,之后是待机功耗,第三列是转码时的功耗,

文档评论(0)

1520520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档