网站大量收购独家精品文档,联系QQ:2885784924

基于opencl并行加速算法研究及其fpga实现-检测技术与自动化装置专业论文.docxVIP

基于opencl并行加速算法研究及其fpga实现-检测技术与自动化装置专业论文.docx

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于opencl并行加速算法研究及其fpga实现-检测技术与自动化装置专业论文

万方数据 万方数据 分类号:TP391.41 学校代号:10490 学 号 :201104004 密 级:公开 武汉工程大学硕士学位论文 基于 OpenCL 并行加速算法研究 及其 FPGA 实现 作者姓名:彭新显 指导教师姓名、职称:杨志方 副教授 申请学位类别:工学硕士 学科专业名称:检测技术与自动化装置 研究方向:嵌入式系统及其应用 论文提交日期:2014 年 6 月 4 日 论文答辩日期:2014 年 5 月 25 日 学位授予单位:武汉工程大学 学位授予日期:2014 年 6 月 19 日 答辩委员会主席: 王典洪教授 Research on Parallel Accelerating Algorithm Based on OpenCL and Realization on FPGA A Thesis Submitted for the Degree of Master Major:Detection Technology and Automation Devices Candidate:Peng Xin Xian Supervisor:Prof. Yang Zhi Fang Wuhan Institute of Technology Wuhan, Hubei 430073, P. R. China 独 创 性 声 明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外, 本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。 对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。 本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:彭新显 2014 年 6 月 4 日 学位论文版权使用授权书 本学位论文作者完全了解我校有关保留、使用学位论文的规定, 即:我校有权保留并向国家有关部门或机构送交论文的复印件和电 子版,允许论文被查阅。本人授权武汉工程大学研究生处可以将本 学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或扫描等复制手段保存和汇编本学位论文。 保 密 Ο , 在 年解密后适用本授权书。 本论文属于 不保密√。 (请在以上方框内打“√”) 学位论文作者签名:彭新显 指导教师签名:杨志方 2014 年 6 月 4 日 2014 年 6 月 4 日 摘 要 摘 要 随着科学技术、数字信息化的不断进步,并行计算已经深入高性能开发的各个 领域,单平台单计算的速度和性能已完全不能满足人们的需求,高性能低功耗的平 台成为了未来发展的趋势。从单核到多核,从 CPU、GPU、DSP 到 FPGA,再到它 们之间的多核组合,甚至基于 OpenCL 的 GPU 异构平台虽然实现了并行计算的性 能提升,但是都没能解决硬件和软件协同设计的难题。Altera 面向 OpenCL 的 SDK 的提出结合了 FPGA 强大的并行体系结构和 OpenCL 并行编程模型,可以实现强大 的系统功能,在超低功耗基础下实现高性能。利用这一 SDK,熟悉 C 语言的系统 开发人员和编程人员能够迅速方便的在高级语言环境中开发高性能、高功效、基于 FPGA 的应用。 本文首先研究了并行异构的相关知识,总结了当前国内外的研究现状及目前存 在的问题;继而对 OpenCL 的并行架构做了详细的解析,并详细对比了它在 CPU、 GPU 和 FPGA 平台上实现的特点。 然后介绍了在 FPGA 上实现 OpenCL 的优势及实现的方法和架构,并详细介绍 了在 DE5-NET FPGA 平台上开发 OpenCL 的开发环境以及实现方法等。 最后本文分别以稀疏矩阵向量乘法(SpMV)和图像 Sobel 边沿检测算法为实验对 象,分析算法内存在的并行性,并在 DE5-NET FPGA 平台上用 OpenCL 加速内核算 法,并与基本的 GPU 平台相比较,进行性能测试,分析比较加速效果及功耗。 实验结果表明,与传统 CPU 的串行算法和基于 GPU 平台上采用 OpenCL 加速 相比,本文设计的基于 FPGA 平台的 OpenCL 的并行算法在保证实现算法质量和效 率的同时,能够有效地提高计算效率,使计算速度得到显著加快,并且在很大的程 度上降低了系统的功耗。 关键词:并行计算;FPGA;OpenCL;Sobel;稀疏矩阵矢量乘法 I 武汉工程大学硕士学位论文 II Abstract Abstract With the continuou

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档