基于GPU＋CPU的CANNY算子快速实现.PDF

下载文档 降价啦

28
0
约3.78万字
约 7页
2017-06-30 发布于天津
举报
版权申诉
保障服务

基于GPU＋CPU的CANNY算子快速实现.PDF

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于GPU＋CPU的CANNY算子快速实现

第卷第期液晶与显示３１　７　　 Vol．３１　No．７　　　　　　　　　　　ChineseJournalofLiuidCrstalsandDislas 年月 q y p y ２０１６７　　　 Jul．２０１６文章编号: ( ) １００７Ｇ２７８０２０１６０７Ｇ０７１４Ｇ０７基于的算子快速实现 GPU＋CPU CANNY ∗ ２ , 唐斌龙文　　 ( , ; １．贵州财经大学信息学院贵州贵阳５５００２５ , ) ２．贵州财经大学贵州省经济系统仿真重点实验室贵州贵阳５５００２５ : . , 、摘要本文提出一种基于GPU＋CPU的快速实现Canny算子的方法首先将算子分为串行和并行两部分高斯滤波梯、 , 度幅值和方向计算非极大值抑制和双阈值处理在 GPU中完成将二维高斯滤波分解为水平方向上和垂直方向上的两 ; ; 次一维滤波从而降低计算的复杂度然后使用 CUDA编程完成多线程并行计算以加快计算速度最后使用共享存储器 ; . : 隐藏线程访问全局存储的延迟在 CPU中则使用队列 FIFO完成边缘连接仿真测试结果表明对分辨率为１０２４×１ , , , 的位图像的处理时间为相对应单独使用而言加速比最高可达倍因此本文方法充分利用了０２４８１２２ms CPU ５．３９ GPU的并行性的特征和CPU的串行处理能力. : ; ; ; 关键词加速　　 CANNY CUDA GPU 中图分类号: 文献标识码: : / TP３３３　　 A　　doi１０．３７８８YJYX０７１４ FastCann alorithmbasedonGPU＋CPU y g １∗ ２ , TANGBin LO