基于混合并行计算的遗传退火多序列比对算法研究-计算机应用技术专业论文.docxVIP

基于混合并行计算的遗传退火多序列比对算法研究-计算机应用技术专业论文.docx

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 研究生学位论文独创性声明和版权使用授权书 独创 性声明 本人卢叨:所旦交的论文是本人在导师指导下进行的研究_l作取得的研究成果. 据找所知 ,除了文中特别加以标法和致谢的地方外 ,论文中不包含他人已经发友或槐叮 ii的研究成果,也不包含为获得其它教育机构的学位或iiEt 而使用过的材料.对论文的 完成提供过梢助的有关人员己在论文巾作了明确的说明并求尽谢怠. 学位论文作者(签字):在巨?止1饵主 签字 n期: i-?缸4矿! 学位论文版权使用授权书 本学位论文作丘克今:了解(学校)有关保留、使用学位论文的规定,干 J权保留并向同 家有关部门!! 机构送交论文的印刷本和电于版本,允许论文被查|刻和借阅 .4人授权(学 校)可以将学位论文的全部或部分内容编入fJ关数据J1f. ill行价线,可以采用影印、缩印 或打捕邻复制予段保在、$L编学位论文.同时授仪巾凶科学技术信息研究所将本学位论 文收求到利国学位论文余文数据库)) ,并通过网络向祉会公众提供信息服务. (保密的 学位论文在解省后远用本授权书〉 密: 是 布 ;::rz的异 fV ;::rz的异 签子口期:)CI时f 月 叫口 摘要 信息技术的高速发展使得生物序列数据呈爆炸性增长,如何高效处理和分析这些 海量数据,是当前要面对的一个挑战。序列比对是生物信息分析最基本的处理方法, 由于比对过程耗时极大,利用并行计算技术对计算加速成为重要研究课题。而混合并 行模型是近年来通用并行计算平台的新热点,它可充分发挥并行系统的综合计算能 力。因此结合基于消息传递 MPI、共享内存的 OpenMP 和 CUDA 并行编程模型,实 现基于多机、多核 CPU、众核 GPU 的并行模型,将该模型应用于序列比对研究是一 个很有前景的研究方向。 基于遗传模拟退火多序列比对(GSA-MSA)算法是全局比对算法,论文主要对混合 并行下的 GSA-MSA 算法进行并行化研究。为了实现并行加速,对混合并行系统的硬 件架构 、执行 模型 、混合 编程编 译方 法和并 行性 能指标 等进 行详细 研究, 剖析 GSA-MSA 算法的实现原理和串行算法特点,对其潜在多层次并行性进行挖掘。针对 该算法在多种的混合并行模型下进行全面的多级并行化设计与实现,分别设计单节点 内 CUDA 并行算法、多节点间的 MPI+OpenMP、MPI+CUDA、MPI+OpenMP+CUDA 的混合并行算法,并且从通信、任务划分、负载均衡、存储方式方面进行优化处理。 在并行算法的性能评估中,利用 5 种参数模型测试分析算法的适应度结果、执行 时间、加速比和可拓展性;对混合并行算法的通信代价、负载均衡和内存容量耗用进 行算法的适用性测试分析;最后综合分析评估各种参数模型下多种 GSA-MSA 混合并 行算法的整体性能。实验取得了以下的研究结果: 1、各个混合模型的 GSA-MSA 并行算法都能保持和串行算法的结果误差小于 0.15%,在序列数量越大、长度越小时,并行算法的执行速度越具有明显优势。 2、在加速比测试中,五个参数模型的并行算法都有较好加速效果,单节点内 CUDA 算法最高加速比达到 113.60;4 节点 MPI+OpenMP 达到 13.88 以上;由于测试 环境各节点内只有一个 GPU,MPI+CUDA 与 MPI+OpenMP+ CUDA 的加速比相差不 大,OpenMP 加速效果不明显。三层混合算法对长序列的加速比达到 256.86,短序列 可高达 393.42。另外,并行算法拥有较好的可拓展性,在增大种群数量和温度控制时, 加速效果更为明显,增大遗传迭代次数时,各参数模型的加速效果基本一致。 3、并行算法适用性评估中,三层混合并行算法能很好的控制通信代价,通信耗 时占总时间的 2.23%以下。节点间的计算时间差不大于总时间的 6.69%,负载均衡较 为理想,节点内也实现了良好的动态线程块和线程分配方式。此外,测试中,GPU 显 存耗用不到 217MB,说明还有一定的可提升空间。 实验结果表明,混合并行的 GSA-MSA 算法在保持了串行算法的敏感度下,具有 较好的加速比、可拓展性和适用性。研究成果对混合并行计算的研究和多序列比对并 行化研究具有一定的参考价值与实用意义。 关键字:混合并行计算,遗传退火,序列比对,MPI,OpenMP,CUDA I Abstract The explosive growth of biological sequence data has been influenced by the rapid development of information technology. It is a major challenge to efficiently process

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档