- 10
- 0
- 约1.96万字
- 约 26页
- 2016-04-02 发布于湖北
- 举报
DNA序列问题模型.doc
2015年芜湖三校数学建模竞赛
题 目 DNA序列问题模型
摘 要
DNA 序列是由A,T,G,C 四个表示4 种碱基的字符组成的序列。本文研究DNA 序列的结构找出序列间的差异和对八个物种八个物种八个物种
2)假设具有特殊碱基的DNA序列中,特殊碱基可以剔除,其影响可以忽略;
3)8个物种DNA序列具有共同的特征;
假设给定的DNA序列均是从全序列中随机截取出来的,无法确定序列的起始位, 无法从序列中辨认出氨基酸,所以,在对DNA 序列分类时,从碱基层次上进行分类, 而不是从氨基酸层次上分类;
不考虑碱基序列的编码区和非编码区的区别;
题目中所给的样本信息量足够大;
题目附录中所给的数据真实可靠。
3 符号说明
:各个DNA序列中碱基出现的数量,i为A、T、C或G
:第i个DNA序列的总碱基数目
:各个DNA序列中碱基的丰度,i为A、T、C或G
:各个DNA序列中碱基i和碱基j的比值,i,j为A、T、C或G
:DNA序列中A、C、G、T的重复次数矩阵
:DNA序列中A、C、G、T的所占百分量矩阵
:第i个DNA序列相邻碱基占序列相邻情况的百分比,为A、C、T或G
:R型聚类的特征向量
:DNA序列中四个碱基之间丰度比矩阵
4 模型的建立及求解
问题一模型的建立及求解
问题分析
首先对数据运用数理统计方法对数据进行计算,得到八个物种
原创力文档

文档评论(0)