- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于GPU图像去噪总变分对偶模型并行计算
基于GPU图像去噪总变分对偶模型并行计算
摘要:研究基于总变分(TV)的图像去噪问题,针对中央处理器(CPU)计算速度较慢的问题,提出了在图像处理器(GPU)上并行计算的方法。考虑总变分最小问题的对偶模型,建立原始变量与对偶变量的关系,采用梯度投影算法求解对偶变量。数值实验分别在GPU与CPU上进行。实验结果表明,总变分去噪模型对偶算法在GPU设备上执行的效率高于在CPU上执行的效率,并且随着图像尺寸的增大,GPU并行计算的优势更加突出。
关键词:并行计算;总变分;图像去噪; 图像处理器
中图分类号:TN911.73 文献标志码:A
Abstract: The problem of Total Variation (TV)based image denoising was considered. Since the traditional serial computation speed based on Central Processing Unit (CPU) was low, a parallel computation based on Graphics Processing Unit (GPU) was proposed. The dual model of the total variationbased image denoising was derived and the relationship between the primal variable and the dual variable was considered. The projected gradient method was applied to solve the dual model. Numerical results obtained by CPU and GPU show that the algorithm implemented by GPU is more efficient than that by CPU, and with the increasing of image size, the advantage of GPU parallel computing is more outstanding.
Key words:parallel computation; Total Variation (TV); denoising; Graphics Processing Unit (GPU)
0 引言
在物理成像系统以及传输过程中,图像常常被噪声污染而退化,从而造成视觉损伤,故图像去噪是图像处理过程中的一项重要操作。图像去噪经过几十年的研究,已取得重大成果,但它仍然是充满活力的领域[1]。随着科技的发展,图像尺寸持续增加,要求新算法提出的同时也需要计算硬件设备的更新。由过去单纯提高单核时钟频率来提升设备计算性能的技术达到瓶颈后,利用多核并行计算提升设备计算性能已成为研究的热点。
图像处理器(Graphics Processing Unit, GPU)是早期为实现图形实时渲染着色而开发的图形处理设备,它拥有众多计算核心和高带宽,因此具有很高的计算吞吐量[2]。实验表明,它是大规模并行计算得以实现的合适硬件设备。经过数十年的开发研究,一种基于统一计算设备单元(Compute Unified Device Architecture, CUDA)新架构构建的GPU可以方便地使用C语言的扩展语言实现并行化计算[3]。CUDA C一经面世,它便成为人们主要关注的对象。许多重要领域都积极研究开发基于GPU的应用程序,例如,模式识别、基因(DeoxyriboNucleic Acid,DNA)序列校对、计算流体力学、量子力学和环境科学等。随着CUDA技术的逐渐成熟,图像处理领域的研究者也正在积极地将其引入到该领域中,特别是医学图像TechniScan的基于CUDA架构的超声波成像系统,使得医生可在20min内获得患者高清三维图像。
在图像处理过程中,一幅灰度图像可以对应一个二维矩阵或一个列向量,列向量是由二维矩阵转化来的。由Rudin,Osher和Fatemi提出的总变分去噪模型(RudinOsherFatemi, ROF)[4],可以高效去除图像噪声,保留图像的边缘信息。ROF模型是根据式(1)得出:
近年来,研究者提出了许多关于总变分模型的算法,例如原对偶算法[6]、对偶算法[7-8]和Chambolle 算法[9]。这些算法包含相当的计算量,随着图片像素的不断提高以及图片尺寸的增大,给实时图像处理带来巨大的挑战。尽管GPU的新架构CUDA可以实现并行计算,但并不是所有的算法
原创力文档


文档评论(0)