- 32
- 0
- 约5.7万字
- 约 63页
- 2021-04-15 发布于江苏
- 举报
摘要摘要
摘要
摘要
MrBayes是一款在生物信息学(Bioinformatics)领域被广泛使用的软件。 它使用Metropolis coupled Markov chain Monte Carlo(MC3)算法进行贝叶斯系 统发育推断(Bayesian phylogenetic inference)。
随着DNA测序技术的发展,研究人员可用的真实DNA数据越来越多。特 别是在新一代的DNA测序技术——大规模并行测序(massively parallel sequencing)——问世之后,可用的真实DNA数据的数量更是以指数方式增长,
而且这些数据的规模越来越庞大,构成也越来越复杂。对这些大规模复杂的真 实DNA数据进行分析是生物研究领域的一个热门问题,更是研究人员的一个 迫切需求。然而,迄今为止,无论是串行的MrBayes MC3算法,还是它的改进 与并行版本,都无法满足研究人员处理如此大规模数据的需求。幸运的是,越 来越多新兴的并行或分布式平台可以为研究人员提供帮助,譬如多核中央处理 器(CPU)与图形处理器(GPU)。特别是GPU,作为一个协处理器(确切的 说,是一个加速器),已经在许多领域展示了自己强大的能力。
本文描述了两种新的针对MrBayes MC3的并行算法:一种是针对多核CPU 集群的hMC3算法,另一种是针对CPU.GPU异构平台的nMC3算法。hMC3算 法将一种针对MrBayes MC3的链间(inter-chain)并行技术与一种链内 (intra.chain)并行技术结合在一起,以期获得更高的并发度。在一个异构的多 核CPU集群上分析四个真实DNA数据集的实验结果表明,与单纯的链间和链 内并行算法相比,hMC3算法的确将更多的CPU核心转化为更高的加速比。nMC3 算法从两个层次上并行MrBayes MC3:CPU端的链间并行与GPU端的链内并 行。nMC3算法使用一种流水线模型协调这两个层次的并行。这个流水线模型能 够有效隐藏CPU与GPU之间的通信开销。而且,借助于这个流水线模型,在 新一代的Fermi CUDA架构上,nMC3算法进一步提高了MrBayes MC3计算过 程的并发度。在一台普通的装有两个GPU的个人电脑上分析五个真实DNA数
据集的实验结果表明,nMC3算法比之前所有的MrBayes MC3算法(包括串行 的与并行的)都要快很多(加速比最高达40倍),而且nMC3算法具有良好的 伸缩性。nMC3算法的意义不仅仅是帮助研究人员缩短了实验周期,更重要的是
摘要使他们能够处理更大规模更复杂的数据集,为这个领域开辟新的研究内容提供
摘要
使他们能够处理更大规模更复杂的数据集,为这个领域开辟新的研究内容提供
了可能。
关键词:MrBayes,MC3,并行算法,CPU,GPU,CUDA
.II.
AbstractAbstract
Abstract
Abstract
MrBayes is a widely-used software package in the field of Bioinformatics.It performs Bayesian phylogenetic inference using Metropolis coupled Markov chain Monte Carlo(MC3).
Concomitant with the improvement in the DNA sequencing technologies,there have been more and more available real—world DNA data.In particular,after the advent of the next generation DNA sequencing technology,Massively Parallel Sequencing,the amount of available real-world DNA data have been growing exponentially,and these data become more and more large—scale and complicated.It is a hot issue and urgent need for the researchers in the field of biology to analyze these large.scale and complicated real-world DNA data.However,SO f缸both the serial MrBayes
MC’and its improved and parallel versions
您可能关注的文档
- 低温催化剂的生成机制和硫化作用机制.docx
- 财务预警回归模型的构建与检验——以我国制造业上市公司为例.docx
- 负调控下游靶基因促进肺腺癌始动细胞侵袭迁移作用的.docx
- 双模通信系统信道估计的实现.docx
- 摩托车电喷匹配试验分析.docx
- 法与传统方法确定正中关系的临床对比.docx
- 精确分型及采样和储存方法用于宫颈癌筛查的.docx
- 和在鲍温病和皮肤鳞状细胞癌中的表达.docx
- 场景的移动性策略.docx
- 病人营养状况及补充微量营养素对其免疫功能的影响.docx
- 抚顺石化工贸中心资金控制体系优化研究:理论、实践与创新.docx
- 探秘中华通草蛉滞育发育:生殖生物学特征与调控机制.docx
- 稀有鮈鲫受精机制及影响因素的深度剖析.docx
- 从美国强制反诉制度探寻我国民事诉讼反诉制度的革新路径.docx
- 中国职业足球管理体制:演进、困境与突破路径探究.docx
- 论我国网上个体经营活动法律规制的完善与实践.docx
- 论取保候审期间脱逃后又归案的自首认定困境与出路.docx
- 动调陀螺赋能双轴稳定平台控制系统的关键技术与优化策略研究.docx
- 论我国犯罪被害人国家补偿制度的构建与完善:法理、实践与发展路径.docx
- 光纤光栅传感监控软件:原理、应用与创新发展研究.docx
最近下载
- 2026年春教科版(新教材)小学科学二年级下册(全册)教学设计(附目录P91).pdf
- 2026年山东劳动职业技术学院单招(计算机)考试备考题库及答案解析(夺冠).docx VIP
- 超实用近五年(2021-2025)高考英语真题分类汇编:专题17 语法填空(全国通用)(原卷版).docx VIP
- 时尚流行文化解读.pptx VIP
- 文学类文本阅读青辰《梨花开了》【2023年四川省凉山州中考语文真题】.docx VIP
- 《毛笔楷书基础教程》职业院校书法课程全套教学课件.pptx
- (完整版)交管12123学法减分考试题库及答案.doc
- 2026年山东劳动职业技术学院单招(计算机)考试参考题库附答案.docx VIP
- 2025年教师资格考试高中学科知识与教学能力思想政治试卷与参考答案.docx VIP
- 基建项目财务咨询方案.docx VIP
原创力文档

文档评论(0)