基于aws云平台gpu集群加速的apriori算法的研究和应用-计算机软件与理论专业论文.docxVIP

  • 2
  • 0
  • 约4.51万字
  • 约 52页
  • 2019-01-09 发布于上海
  • 举报

基于aws云平台gpu集群加速的apriori算法的研究和应用-计算机软件与理论专业论文.docx

基于aws云平台gpu集群加速的apriori算法的研究和应用-计算机软件与理论专业论文

硕士学位论文基于AWS云平台GPU集群加速的Apriori算法 硕士学位论文 基于AWS云平台GPU集群加速的Apriori算法 的研究和应用 Research and Application of AWS GPU Cluster Based Apriori Algorithm 作者姓名: 学科、 专业: 学 号: 指导教师: 奎建明 副教援 完成日期: 2015—5—2 大连理工大学 Dalian University of Technology 万方数据 大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目:建互仓巡至孟丝理型绉妲塑鱼叁丛!盥鱼纽遮型翊 作者签名: 翌签!垄! 日期:垄!苎年—厶月』L日 万方数据 大连理工大学硕士学位论文摘 大连理工大学硕士学位论文 摘 要 健康和疾病防控对每一个人都很重要,而大数据时代的到来,给生命科学和健康领 域带来了机遇和挑战。对医疗数据的合理挖掘和使用,将发现临床症状、生活习惯、遗 传等等因素和疾病之间的关联和规律。这将在临床辅助决策、疾病预测、个性化治疗等 等领域起着决定性作用。 Apriori算法是数据挖掘中最经典也是最常用的算法之一,然而对于海量规模的数据, 数据挖掘所需要的计算量也迅速膨胀,Apriori算法过程变得十分耗时,很难满足人们的 需求。如何加速Apriori算法效率,快速地从海量医疗数据中挖掘出有用的关联规则是 一个需要解决的问题。传统的计算机集群技术可以很好的提高算法的效率并且具有较好 的可扩展性,但是其过于高昂的成本以及复杂的架构使得其使用范围极其有限。相对于 CPU来说,GPU有着更多的执行单元,使得GPU有着高性能的并行计算能力。通过 GPU的并行计算能力的使用可以在成本较低的情况下得到较好的加速效果,但是主机中 显卡数目的限制使得它可扩展性不高,很难应对应用需求越来越大的计算量。 亚马逊云平台允许用户通过低廉的租用成本来使用海量的云计算资源,基于此,提 出一种基于亚马逊云平台GPU集群加速的Apriori算法,该方法通过按需计费的方式来 使用亚马逊的云计算资源,成本低廉;GPU实例中的G2实例包含高性能的NVIDIA GPU, 具有很强的并行计算能力,可以带来良好的加速效果;亚马逊云服务提供弹性的计算能 力,具有良好的可扩展性,可以应对应用的弹性需求。 通过对Apriori算法的分析和并行化设计,提出了基于AWS云平台GPU集群的 Apriori算法。其中解决了AWS中GPU集群的通信设计和搭建、数值型数据离散化和 频繁项集的表示、Apriori算法的多节点多线程的并行设计、基于CUDA存储器模型的 存储优化设计等一系列问题。通过实验得知,该算法具有较好的加速效果、较高的可扩 展性,并且成本更加低廉。利用该算法,初步完成了一个乳腺癌疾病诊断应用,并取得 了较好的效果。证实了本算法在大数据医疗中的可行性,为医疗领域中小企业和个人研 究人员提供了一种低成本、高效率的解决方案。 关键词:hpriori算法;大数据;GPU集群;云计算 万方数据 基于AWS云平台GPU集群加速的Apfiofi算法的研究和应用A 基于AWS云平台GPU集群加速的Apfiofi算法的研究和应用 A research and application of AWS GPU cluster based Apriori algorithm Abstract Health and disease control iS important for everyone.and the arrival of the era of big data,brought the life sciences and health areas opportunities and challenges.Scientific mining and use of medical data wiU find the correlation and regularity between diseases and clinical symptoms,life habit,genetic factors.This will play a decisive role

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档