多序列比对算法族的构件组装研究.pdfVIP

  • 6
  • 0
  • 约7.46万字
  • 约 62页
  • 2020-08-22 发布于江苏
  • 举报
摘 要 近年来随着高通量测序技术的发展以及一系列基因组计划的实施,生物信息 数据呈爆炸式增长,但数据本身不代表信息,从大量数据中获取具有生物学意义 的信息是生物信息学研究的主要目的。序列比对是比较基因组学中的基本手段与 重要方法,它基于生物学中的化学基础。多序列比对问题是序列比对问题研究中 的重要部分,其广泛应用于序列分析、序列注释、基因和蛋白质的结构功能预测、 系统发生树分析等领域。多序列比对算法具有很高的专用性,不同的算法适用于 不同的研究环境。 目前常用的多序列比对算法是在生物信息学理论的指导下利用多个子算法 装配形成,而现有的研究主要针对特定算法的特定步骤,缺乏领域层次高抽象性 的算法框架研究,致使多序列比对算法较为繁杂且冗余过大。研究人员对序列比 对算法的选择往往会产生偏差,导致影响后续的研究工作。随着多序列比对算法 的不断提出,算法软件的可维护性和复用性问题日益显著,会影响多序列比对算 法软件的开发效率。基于构件的开发方法应用了软件复用的思想,可以提高软件 的开发效率、可靠性以及降低软件的开发成本。软件开发的核心在于其内部算法 的开发,软件构件的方法学同样可应用在算法开发上,进一步可根据构件组装的 形式装配形成算法,大大提高算法的开发效率、可靠性及可维护性。 通过对多序列比对算法族的研究,发现多序列比对算法领域 (Domain of Multiple Sequence Alignment Algorithm ,MSAA )包含双序列比对算法(Pairwise Sequence Alignment Algorithm,PSAA )、启发式多序列比对算法(Heuristic Multiple Sequence Alignment Algorithm,HMSAA )、系统发生树生成算法(Phylogenetic Tree Algorithm ,PTA )以及目标函数(Objective Function ,OF) 。根据产生式编程的思想, 对MSAA 进行了领域特征建模和算法构件的交互设计,借助PAR 的支持建立了 MSAA 构件库,装配形成了基于系统发生树的渐进式比对算法,并进行了相关实 验,验证了该方法学的可行性和优越性。 为了方便研究人员对算法构件的组装操作,建立了基于B/S 架构的序列比对 算法构件装配平台,用户在平台中无需了解算法的内部实现,只需选择符合约束 条件的算法构件,即可生成可执行的多序列比对算法。 关键词:多序列比对算法;产生式编程;PAR;算法构件;领域工程 I Abstract In recent years, with the development of high-throughput sequencing technology and the implementation of a series of genome projects, biological information data has exploded, but the data does not represent information. The main purpose of bioinformatics research is to obtain information with biological significance from a large amount of data. Sequence alignment is a basic and important method of comparative genomics, it is based on the chemical basis of biology. Multiple sequence alignment is an important part of sequence alignment research, which is widely used in sequence analysis, sequence annotation, structure and function prediction of genes and proteins, phyloge

文档评论(0)

1亿VIP精品文档

相关文档