- 16
- 0
- 约8.05千字
- 约 22页
- 2023-06-16 发布于湖北
- 举报
基于模糊数学的DNA序列分类
摘要
问题一给出20个已知类别的人工制造的序列,其中序列标号1—10 为A类,11-20为B类。要求从中提取特征,构造分类方法,并用这些已知类别的序列,衡量所选方法是否足够好。然后用认为满意的方法,对另外20个未标明类别的人工序列(标号21—40)进行分类。问题二要求我们对数据文件Nat-model-data 中给出了182个自然DNA序列用我们的分类方法进行分类,像1)一样地给出分类结果。
由于题目所给的碱基序列并没有明显的结构特征,于是我们选择运用模糊聚类分析的方法为A、B两类碱基序列构造分类方法,在运用模糊识别的方法对剩余碱基进行归类。
对于问题一,我们首先运用MATLAB对编号为前20的碱基序列的a、t、g、c的数目进行统计,并算出其在序列中占据的百分比,便得到序列的模糊矩阵。然后用切比雪夫距离法求该模糊矩阵的模糊相似矩阵。对相似矩阵取不同截集,把对应值为1的对象归为一类,找到合适的截集,使编号为前10的序列归为一类,编号为11-20的归为一类。我们的归类结果为:A类:1、2、3、5、6、6、7、8、9、10,B类:11、12、13、14、15、16、18、19、20,非AB类:4、17。对于剩余的20个未知的碱基序列,我们使用模糊识别的方法进行归类。我们使用每种碱基在序列中所占比例为识别规则,于是需先求出A、B和非AB三种类别所包含序列的个碱
您可能关注的文档
- 空巢老人问题与需求.doc
- 三级数据库技术南开100题.doc
- 南开100题三级上机.doc
- 综采维修钳工中级B.doc
- 计算机网络课程设计-基于ICMP的PING设计.doc
- 手机话费信息管理系统课程设计报告.doc
- 5.13 国共合作与北伐战争 课件(内嵌视频)2026-2027学年统编版八年级历史上册.pptx
- 化工企业消防管理常见隐患和风险.pdf
- 眼部肌肤护理的常见误区.pptx
- 煤矿企业各岗位安全生产风险告知.pdf
- 统编版二年级语文上册课件《语文园地八》.pptx
- 眼部肌肤护理的日常习惯.pptx
- 第十单元 常见的酸、碱、盐 复习课(酸碱盐的化学性质)课件(内嵌视频)2025-2026学年九年级化学人教版下册.pptx
- 眼部肌肤护理的科学方法.pptx
- 2.4 磁铁能吸什么 课件(内嵌视频)2026-2027学年科学二年级上册苏教版.pptx
- 统编版二年级语文上册课件《阅读18 古诗二首》.pptx
- 科学二下4.12 寻访小动物的家 课件(苏教版2026新教材).pptx
- 煤矿企业各岗位安全生产风险告知.docx
- 第18课《井冈翠竹》课件-统编版语文七年级下册.pptx
- 第二章气体 液体和固体_气体液体固体单元复习课- 课件 -2026-2027学年高二下学期物理粤教版(2019)选择性必修第三册.pptx
原创力文档

文档评论(0)