dna序列分类模型研究(new)资料.pptVIP

  • 13
  • 0
  • 约5.15千字
  • 约 40页
  • 2017-02-20 发布于湖北
  • 举报
定义四:序列的相关度 对于任意的两个序列AN、BM,定义序列A和序列B的相关序列Si 定义序列B对序列A的相关度为 例如序列A T,C,T 与序列B A,G,T,C,T,C 的相关度为: 公理一:任意给定三个序列S、A、B,若A与S的相关度大于B与S的相关度,则A与S属同一类的可能性大于B与S属同一类的可能性。 基于相关度的分类算法 1、对于任意一个未知序列S将其与序列A1-A20中的每一个依次作求相关度的运算,结果记为SS1,SS2,…SS20。 2、定义S与A、B类的平均相关度分别为 3、判别准则    若SA>SB,则将S判定给A类    若SB>SA,则将S判定给B类    若SA=SB,则将S列为不可判类 4、 W可作为衡量该序列分类的可信性的一个标准,显然当W 越接近于1,该序列与A类的相关性和与B类的相关性区别就越小,分类结果就越不可信。反之W 与1差的越远,该序列与A类的相关性和与B类的相关性区别就越大,分类结果就越可信。 方法五的改进 带反馈的相关度分类算法 一般说来,带反馈的算法以神经网络算法最具有代表性,但对于一般的分类算法而言,可以采用多次反复分类的办法来实现反馈的目的 1、对全部未知样本进行相关度分类,计算出所有未知样本的W值; 2、在所有被判为A类的待分类序列中,取出W值最大的一个作为标准学习样本加入到A类的标准样本中; 3、在所有被判为B类的待分类

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档