运动估计搜索算法的CUDA优化与实现.pdf

运动估计搜索算法的CUDA优化与实现.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运动估计搜索算法的CUDA优化与实现

Computer Engineering and Applications 计算机工程与应用 2010 ,46 (32 ) 171 运动估计搜索算法的CUDA 优化与实现 1 2 1 陈 佐 ,陈 汉 ,季加良 1 2 1 CHEN Zuo ,CHEN Han ,JI Jia-liang 1.湖南大学 计算机与通信学院,长沙 410082 2.长沙行成信息科技有限公司,长沙 410005 1.College of Computer and Communication ,Hunan University ,Changsha 410082 ,China 2.Changsha Xingcheng Information Technology Co. ,Ltd. ,Changsha 410005 ,China E-mail :chenzuo@ CHEN Zuo ,CHEN Han ,JI Jia-liang.Optimization and realization of motion estimation search algorithm based on CUDA. Computer Engineering and Applications ,2010 ,46 (32 ):171-176. Abstract :Motion estimation search algorithm is one of the most time complexity parts of Video Compression Standard H.264.By making full use of the parallel processing ability of GPU ,this paper proposes a parallel process method of GEA algorithm which is based on CUDA computing platform.The applications are discussed separately in details ,such as the paral- lel design ,data processing and results feedback.Finally ,it gives the comparative analysis of the execution efficiency of GEA in GPU and in CPU.The result shows that GPU can improve the performance of search algorithm significantly. Key words :Compute Unified Device Architecture(CUDA );motion estimation ;Global Elimination Algorithm(GEA );parallel computing 摘 要:针对H.264 压缩编码中计算量大以及最为耗时的运动估计搜索算法的特点,利用图形处理器的并行优化思想,研究基于 CUDA 计算平台的运动估计搜索算法GEA (全域消除算法)的并行化处理方法,并对其中的并行设计、数据处理、结果反馈等关键 技术问题,进行了详细论述。最后通过实验数据对算法运行效率进行对比分析。实验结果表明GPU 中的GEA 搜索算法运动搜 索性能较之CPU 中有显著提高。 关键词:统一计算设备架构(CUDA );运动估计;全域消除算法(GEA );并行计算 DOI :10.3778/j.issn. 1002-8331.2010.32.048 文章编号:1002-8331(2010 )32-0171-06 文献标识码:A 中图分类号:TP391.41 近年来,计算机显卡的运算单元速度越来越快,在某些应 力等方法以提高编码效率。但针对性的硬件结构一般用于特 用上,甚至已经大幅超越CPU。基于GPU 的通用计算(General- 定的应用中,通用性不强。 Purpose Computing on Graphics

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档