均衡数据法在蛋白质二级结构预测中的应用.pdf

均衡数据法在蛋白质二级结构预测中的应用.pdf

均衡数据法在蛋白质二级结构预测中的应用 中文摘要 均衡数据法在蛋白质二级结构预测中的应用 中文摘要 近年来生物学的发展积累了海量的实验数据,研究这些数据中隐含的生物学意义 尤为重要。目前,生物信息学中最受关注的问题之一就是怎样从蛋白质的一级序列得 到其三级结构,而二级结构是构成三级结构的基本单元。计算机预测方法被广泛应用 于蛋白质二级结构的研究,其发展过程大体分为三个阶段:第一阶段以数理统计作为 出发点,基于单个氨基酸信息,如Chou-Fasman 和GOR 方法;第二阶段基于进化信 息,主要利用BLAST 等工具在序列数据库中对搜索序列进行多重比对以取得同源信 息利用PSI-BLAST 取得相应的进化信息 PSSM ;第三阶段的预测方法则在第二阶段 的基础上加入了同源序列的信息,所以预测精度更高,现在人们研究的方法大都属于 第三阶段。为提高蛋白质二级结构预测精度,本文提出一种均衡数据法来对一般预测 工具的结果进行处理。具体做法为:首先在蛋白质结构分类数据库SCOP 中选择100 条已知结构的蛋白质 (共 16818 个残基),作为训练集。采用PHD 、NNP

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档