数学建模DNA分类.docVIP

  • 16
  • 0
  • 约8.05千字
  • 约 22页
  • 2023-06-16 发布于湖北
  • 举报
基于模糊数学的DNA序列分类 摘要 问题一给出20个已知类别的人工制造的序列,其中序列标号1—10 为A类,11-20为B类。要求从中提取特征,构造分类方法,并用这些已知类别的序列,衡量所选方法是否足够好。然后用认为满意的方法,对另外20个未标明类别的人工序列(标号21—40)进行分类。问题二要求我们对数据文件Nat-model-data 中给出了182个自然DNA序列用我们的分类方法进行分类,像1)一样地给出分类结果。 由于题目所给的碱基序列并没有明显的结构特征,于是我们选择运用模糊聚类分析的方法为A、B两类碱基序列构造分类方法,在运用模糊识别的方法对剩余碱基进行归类。 对于问题一,我们首先运用MATLAB对编号为前20的碱基序列的a、t、g、c的数目进行统计,并算出其在序列中占据的百分比,便得到序列的模糊矩阵。然后用切比雪夫距离法求该模糊矩阵的模糊相似矩阵。对相似矩阵取不同截集,把对应值为1的对象归为一类,找到合适的截集,使编号为前10的序列归为一类,编号为11-20的归为一类。我们的归类结果为:A类:1、2、3、5、6、6、7、8、9、10,B类:11、12、13、14、15、16、18、19、20,非AB类:4、17。对于剩余的20个未知的碱基序列,我们使用模糊识别的方法进行归类。我们使用每种碱基在序列中所占比例为识别规则,于是需先求出A、B和非AB三种类别所包含序列的个碱

文档评论(0)

1亿VIP精品文档

相关文档