DNA序列问题模型.docVIP

  • 10
  • 0
  • 约1.96万字
  • 约 26页
  • 2016-04-02 发布于湖北
  • 举报
DNA序列问题模型.doc

2015年芜湖三校数学建模竞赛 题 目 DNA序列问题模型 摘 要 DNA 序列是由A,T,G,C 四个表示4 种碱基的字符组成的序列。本文研究DNA 序列的结构找出序列间的差异和对八个物种八个物种八个物种 2)假设具有特殊碱基的DNA序列中,特殊碱基可以剔除,其影响可以忽略; 3)8个物种DNA序列具有共同的特征; 假设给定的DNA序列均是从全序列中随机截取出来的,无法确定序列的起始位, 无法从序列中辨认出氨基酸,所以,在对DNA 序列分类时,从碱基层次上进行分类, 而不是从氨基酸层次上分类; 不考虑碱基序列的编码区和非编码区的区别; 题目中所给的样本信息量足够大; 题目附录中所给的数据真实可靠。 3 符号说明 :各个DNA序列中碱基出现的数量,i为A、T、C或G :第i个DNA序列的总碱基数目 :各个DNA序列中碱基的丰度,i为A、T、C或G :各个DNA序列中碱基i和碱基j的比值,i,j为A、T、C或G :DNA序列中A、C、G、T的重复次数矩阵 :DNA序列中A、C、G、T的所占百分量矩阵 :第i个DNA序列相邻碱基占序列相邻情况的百分比,为A、C、T或G :R型聚类的特征向量 :DNA序列中四个碱基之间丰度比矩阵 4 模型的建立及求解 问题一模型的建立及求解 问题分析 首先对数据运用数理统计方法对数据进行计算,得到八个物种

文档评论(0)

1亿VIP精品文档

相关文档