7、比对统计学显著性.docVIP

  • 6
  • 0
  • 约1.73万字
  • 约 16页
  • 2017-08-07 发布于湖北
  • 举报
7、比对的统计学显著性 对于任何序列比对,我们可以计算其相似性得分,但重要的是需要判定这个分值是否足够高,是否具有显著意义(Karlin and Altschul,1990; Alexandrov and Solovyev,1998),是否能够提供进化同源性的证据。由于随机因素的影响,非同源的序列也可能具有较高的相似性得分。不幸的是,没有一种数学理论方法描述全局序列比对的期望得分的分布,无法直接分析统计显著性,需进行间接分析。下面介绍几种显著性检验的方法(王槐春,1994)。 序列相似的显著性检验的典型方法是将两条待比较的序列分别随机打乱,再使用相同的程序与打分函数(或打分矩阵)进行比对,计算这些随机序列的相似性得分。重复这一过程(通常为50(100次),得到随机序列比对得分的正态分布曲线,用(和(分别表示其平均值与标准差。设原来两条序列的比对得分为x,利用下式计算大于或等于x的比对得分概率: z = (x - ()/( (3-32) z值的单位为SD。根据正态分布,当z值为3.1、4.3和5.2时,相似性得分为x的随机出现概率分别为10-3、10-5和10-7。可以根据z值判断两个序列相似得分的显著性。一般假定当z值大于5时,两条被比较的序列在进化上是相关的;当z值在3(5之间时,如果两者有其他方面相似的证据(如功能

文档评论(0)

1亿VIP精品文档

相关文档