数学建模DNA分类.docVIP

下载本文档

16
0
约8.05千字
约 22页
2023-06-16 发布于湖北
举报

数学建模DNA分类.doc

基于模糊数学的DNA序列分类摘要问题一给出20个已知类别的人工制造的序列，其中序列标号1—10 为A类，11-20为B类。要求从中提取特征，构造分类方法，并用这些已知类别的序列，衡量所选方法是否足够好。然后用认为满意的方法，对另外20个未标明类别的人工序列（标号21—40）进行分类。问题二要求我们对数据文件Nat-model-data 中给出了182个自然DNA序列用我们的分类方法进行分类，像1）一样地给出分类结果。由于题目所给的碱基序列并没有明显的结构特征，于是我们选择运用模糊聚类分析的方法为A、B两类碱基序列构造分类方法，在运用模糊识别的方法对剩余碱基进行归类。对于问题一，我们首先运用MATLAB对编号为前20的碱基序列的a、t、g、c的数目进行统计，并算出其在序列中占据的百分比，便得到序列的模糊矩阵。然后用切比雪夫距离法求该模糊矩阵的模糊相似矩阵。对相似矩阵取不同截集，把对应值为1的对象归为一类，找到合适的截集，使编号为前10的序列归为一类，编号为11-20的归为一类。我们的归类结果为：A类：1、2、3、5、6、6、7、8、9、10，B类：11、12、13、14、15、16、18、19、20，非AB类：4、17。对于剩余的20个未知的碱基序列，我们使用模糊识别的方法进行归类。我们使用每种碱基在序列中所占比例为识别规则，于是需先求出A、B和非AB三种类别所包含序列的个碱

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数学建模DNA分类.docVIP