- 5
- 0
- 约1.64千字
- 约 12页
- 2016-10-08 发布于重庆
- 举报
基于GPU并行处理的图像HAAR小波分解
理论基础 程序实现 实现效果 实现效果 L/O/G/O 基于GPU并行处理的图像 HAAR小波分解 报告人:王欣博 1014203044 同组成员:窦汝鹏1014203030 实现背景 并行计算 CUDA Nvidia公司维护的GPU编程架构,包括显卡驱动及运行时函数 ,目前最通用的GPU计算工具 MKL Intel支持的并行计算算法库,速度很快,被很多项目所应用 OpenCl 最有影响力的开源GPU计算工具,AMD显卡基本是以OpenCl为默认开发工具 OpenBlas 开源的并行算法库,与MKL速度不相上下 显卡计算优劣势 优势 劣势 程序架构与以往的串行结 构有较大不同,不易掌握 调试不方便 对于大量重复性运算速 度很快 除了速度快还是速度快 GPU实现优势 GPU实现劣势 不适用与需要做大量控制 及数据读写的操作 我们的目标 我们选用CUDA来进行小波分解的GPU实现 查看实现效果,并与别人的效果进行比对 针对CPU代码与GPU代码运行速度进行比较 实现HAAR小波分解。 GPU实现 试验效果 结论对比 我们用串行代码来实现Haar小波分解 CPU实现 HAAR小波:在图像中可以理解为卷积核为[-1 1],[1 1]的一维卷积,不同组合的死副图像形成该尺度下的尺度变换 HAAR小波应用:应用于图像压缩,可将图像变为稀疏矩阵 算法设计 Haar小波分解实际上是对图像做两次1D卷积,卷积核为时域部分的L:[1 1]和频域部分的H:[-1 1]。进行一次小波分解会出来四张图片,分别为LL,LH,HL,HH,即x轴L,y轴L。。。等等 卷积函数具有很高的可并行性,非常适合显卡运算。我们将图像分成若干16*16的block,每个block对应于显卡中的一个block,即256个线程,每个线程通过共享内存实现和卷积核的加权运算。 这里由于haar小波的卷积核非常小,为了避免数据传递延时,我们这里采用纹理内存的方式实现数据快速访问。将输入图像与一个纹理绑定,每个block中线程的位置,搜索纹理内存中对应的像素,并进行求和或减法。 程序实现 利用opencv接口读取图像 将图像变为float型数据,并导入自己定义的图像结构 这里我们设计每个block有16*16个线程 实现卷积的具体函数 编译并查看效果 编写wrapper函数 编写核函数 设计线程 数据转换 导入图像 Steps 进行核函数调用,并完成数据传递 分析运行速度 核函数: __global__ void CGHaarRow(float *d_Result, int dataW, int dataH, int midSize) __global__ void CGHaarColumn ( float *d_Result, int dataW, int dataH, int midSize) wrapper函数: Core::CGDwtHaar_CUDA(CGImagefloat *ImgDst, CGImagefloat *ImgIn) 图像数据: CG::Core::CGImagefloat *ImgIn = new CG::Core::CGImagefloat(m_Image.cols, m_Image.rows); 线程设计: dim3 gridSize((ImgIn-width + 16 - 1) / 16, (ImgIn-hight + 16 - 1) / 16); dim3 blockSize(16, 16); 原始图像 尺度为1的分解 尺度为2的分解 尺度为3的分解 CPU与GPU代码速度比较 CPU GPU 尺度1:2ms 尺度3:3ms 尺度1:5ms 尺度3:20ms CPU小波分解运行时间 GPU小波分解运行时间 尺度2:3ms 尺度2:11ms L/O/G/O Thank You!
您可能关注的文档
- 本案分期归还的欠款是否超过诉讼时效.doc
- 本案容留他人吸毒致死应否赔偿.doc
- 本案工程款应怎样结算.doc
- 本案应否增加被告.doc
- 本案原告所提精神赔偿应否支持.doc
- 本案应由谁承担清偿责任.doc
- 本案用户吴某与空调公司构成何种法律关系.doc
- 本案章某是否有优先购买权.doc
- 本案原告不能提供被告详细地址应驳回起诉.doc
- 本案经营权可否成为商品.doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 幽默卡通动漫笑点设计方法.docx VIP
- 行星式球磨机立式-FOCUCY弗卡斯.PDF VIP
- 贵州省六校联考2025届高三下学期3月高考实用性联考(四)英语试卷(含答案).docx VIP
- 颈椎病的中医护理课件.pptx VIP
- 原调正谱G小小蝴蝶la farfalletta钢琴伴奏高清打印版.pdf VIP
- 上海大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(B卷)附参考答案.pdf
- 广发证券-交通银行-601328-零售转型提速,定增落地夯实资本根基.pdf
- 上海大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- 循环系统护理小讲课.pptx
- 建筑屋面西瓦专项施工方案(范本).doc VIP
原创力文档

文档评论(0)