- 1、本文档共76页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于opencl并行加速算法研究及其fpga实现-检测技术与自动化装置专业论文
万方数据
万方数据
分类号:TP391.41 学校代号:10490
学 号 :201104004 密 级:公开
武汉工程大学硕士学位论文
基于 OpenCL 并行加速算法研究 及其 FPGA 实现
作者姓名:彭新显 指导教师姓名、职称:杨志方 副教授 申请学位类别:工学硕士 学科专业名称:检测技术与自动化装置 研究方向:嵌入式系统及其应用
论文提交日期:2014 年 6 月 4 日 论文答辩日期:2014 年 5 月 25 日 学位授予单位:武汉工程大学 学位授予日期:2014 年 6 月 19 日 答辩委员会主席: 王典洪教授
Research on Parallel Accelerating Algorithm Based on OpenCL and Realization on FPGA
A Thesis Submitted for the Degree of Master
Major:Detection Technology and Automation Devices
Candidate:Peng Xin Xian Supervisor:Prof. Yang Zhi Fang
Wuhan Institute of Technology Wuhan, Hubei 430073, P. R. China
独 创 性 声 明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外, 本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。 对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。 本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名:彭新显
2014 年 6 月 4 日
学位论文版权使用授权书 本学位论文作者完全了解我校有关保留、使用学位论文的规定,
即:我校有权保留并向国家有关部门或机构送交论文的复印件和电 子版,允许论文被查阅。本人授权武汉工程大学研究生处可以将本 学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或扫描等复制手段保存和汇编本学位论文。
保 密 Ο , 在 年解密后适用本授权书。
本论文属于
不保密√。
(请在以上方框内打“√”)
学位论文作者签名:彭新显 指导教师签名:杨志方
2014 年 6 月 4 日 2014 年 6 月 4 日
摘 要
摘 要
随着科学技术、数字信息化的不断进步,并行计算已经深入高性能开发的各个 领域,单平台单计算的速度和性能已完全不能满足人们的需求,高性能低功耗的平 台成为了未来发展的趋势。从单核到多核,从 CPU、GPU、DSP 到 FPGA,再到它 们之间的多核组合,甚至基于 OpenCL 的 GPU 异构平台虽然实现了并行计算的性 能提升,但是都没能解决硬件和软件协同设计的难题。Altera 面向 OpenCL 的 SDK 的提出结合了 FPGA 强大的并行体系结构和 OpenCL 并行编程模型,可以实现强大 的系统功能,在超低功耗基础下实现高性能。利用这一 SDK,熟悉 C 语言的系统 开发人员和编程人员能够迅速方便的在高级语言环境中开发高性能、高功效、基于 FPGA 的应用。
本文首先研究了并行异构的相关知识,总结了当前国内外的研究现状及目前存 在的问题;继而对 OpenCL 的并行架构做了详细的解析,并详细对比了它在 CPU、 GPU 和 FPGA 平台上实现的特点。
然后介绍了在 FPGA 上实现 OpenCL 的优势及实现的方法和架构,并详细介绍 了在 DE5-NET FPGA 平台上开发 OpenCL 的开发环境以及实现方法等。
最后本文分别以稀疏矩阵向量乘法(SpMV)和图像 Sobel 边沿检测算法为实验对 象,分析算法内存在的并行性,并在 DE5-NET FPGA 平台上用 OpenCL 加速内核算 法,并与基本的 GPU 平台相比较,进行性能测试,分析比较加速效果及功耗。
实验结果表明,与传统 CPU 的串行算法和基于 GPU 平台上采用 OpenCL 加速 相比,本文设计的基于 FPGA 平台的 OpenCL 的并行算法在保证实现算法质量和效 率的同时,能够有效地提高计算效率,使计算速度得到显著加快,并且在很大的程 度上降低了系统的功耗。
关键词:并行计算;FPGA;OpenCL;Sobel;稀疏矩阵矢量乘法
I
武汉工程大学硕士学位论文
II
Abstract
Abstract
With the continuou
您可能关注的文档
- 基于pc的数控机床三维自动编程系统的研究-机械电子工程专业论文.docx
- 基于pvm的网络并行计算在遥感图像处理中的应用-水利水电工程专业论文.docx
- 基于pdms的红细胞变形性微通道芯片研究-生物医学工程专业论文.docx
- 基于p2p技术的网络视频教学系统的研究-通信与信息系统专业论文.docx
- 基于m-bus的水表联网抄表系统-系统分析与集成专业论文.docx
- 基于plc的模糊-pi空调室温控制-供热、通风与空调工程专业论文.docx
- 基于pki技术的安全电子政务系统的设计与实现-计算机软件与理论专业论文.docx
- 基于qad的汽车配件生产及物料拉动系统-工商管理专业论文.docx
- 基于pca字典和两阶段优化的非凸压缩感知重构-计算机应用技术专业论文.docx
- 基于net公文流转系统的分析与设计-软件工程专业论文.docx
文档评论(0)