如何进行序列.ppt

如何进行序列分析资料

序列分析;一、碱基组成 ; 表1包含了9个完整DNA分子序列的资料,表2的数据来自两个胎儿球蛋白基因(Gr和Ar),每个基因具有三个外显子和两个内含子(shen等1981)。这两个例子说明序列内和序列间碱基具有不同的频率。在基因每一侧的500 个任意碱基区域被称为“侧翼”,基因间区域是指两个基因间的其余序列。 ;表1 九种完整DNA序列的碱基组成 ;表2 人类胎儿球蛋白基因不同区段的碱基组成 ;二.碱基相邻频率 ;图1 鸡β球蛋白基因编码区的DNA序列 (GenBank:CHKHBBM,记录号J00860) ;表3 图1鸡β球蛋白基因序列的相邻碱基分布 ; 在编码区,存在某种约束来限制DNA序列编码氨基酸。在密码子水平上,这一约束与碱基相邻频率有关。 表4列出了遗传密码和图1序列中各密码子数量。尽管数目很小,难以作出有力的统计结论,但编码同一氨基酸的不同密码子(同义密码子)好像不是等同存在的。这种密码子偏倚必定与两碱基相邻频率水平有关。 表4还清楚地表明,由于密码子第3位置上碱基的改变常常不会改变氨基酸的类型,因而对第3位置上碱基的约束要比第 2位碱基小得多。 ;表4 64种可能的碱基三联体密码子及相应的氨基酸数(据图1序列) ; 相邻碱基之间的关联将导致更远碱基之间的关联,这些关联延伸距离的估计可以从马尔科夫链(Markov chain)理论得到(Jav

文档评论(0)

1亿VIP精品文档

相关文档