dna序列分类模型研究(new)资料.pptVIP

下载本文档

13
0
约5.15千字
约 40页
2017-02-20 发布于湖北
举报

dna序列分类模型研究(new)资料.ppt

定义四：序列的相关度对于任意的两个序列AN、BM，定义序列A和序列B的相关序列Si 定义序列B对序列A的相关度为例如序列A T,C,T 与序列B A,G,T,C,T,C 的相关度为：公理一：任意给定三个序列S、A、B，若A与S的相关度大于B与S的相关度，则A与S属同一类的可能性大于B与S属同一类的可能性。基于相关度的分类算法 1、对于任意一个未知序列S将其与序列A1－A20中的每一个依次作求相关度的运算，结果记为SS1,SS2,…SS20。 2、定义S与A、B类的平均相关度分别为 3、判别准则　　　若SA＞SB，则将S判定给A类　　　若SB＞SA，则将S判定给B类　　　若SA＝SB，则将S列为不可判类 4、 W可作为衡量该序列分类的可信性的一个标准，显然当W 越接近于1，该序列与A类的相关性和与B类的相关性区别就越小，分类结果就越不可信。反之W 与1差的越远，该序列与A类的相关性和与B类的相关性区别就越大，分类结果就越可信。方法五的改进带反馈的相关度分类算法一般说来，带反馈的算法以神经网络算法最具有代表性，但对于一般的分类算法而言，可以采用多次反复分类的办法来实现反馈的目的 1、对全部未知样本进行相关度分类，计算出所有未知样本的W值; 2、在所有被判为A类的待分类序列中，取出W值最大的一个作为标准学习样本加入到A类的标准样本中； 3、在所有被判为B类的待分类

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

dna序列分类模型研究(new)资料.pptVIP