dna序列蛋白质序列的分析与比较.pdfVIP

  • 34
  • 0
  • 约11.87万字
  • 约 73页
  • 2015-10-21 发布于贵州
  • 举报
dna序列蛋白质序列的分析与比较

摘要 DNA、RNA和蛋自质都是由较小的单元组成的无分枝的线性聚合体大分子。对于 残基;对于RNA,这些单元是A、C、G和U(尿嘧啶)这4种核苷酸残基;对于蛋 白质也可以看作是一个在20个字母上的字.在相当大的程度上,DNA、RNA和蛋自质 分子的化学性质编码在这些基本单元的线性序列中。因此,宇上的组合学和统计学的工 具和方法可以在研究生物分子单元线性序列上发挥很大的作用。 本文的主要工作包括以下几个方面: 在第一章,利用代数中同态的思想和物理学中的。粗粒化”思想,根据DNA序列中 四种核苷酸A、G、C和T的化学结构分类,提出DNA序列的特征序列的概念.一 个DNA序列的特征序列是一组(0,I)序列,它们中的每一个都是这个DNA序列的一个 简约表示,而且用它们中的任意两个都可以重新构造出这个序列;然后,利用特征序列 中所有【0,1)三元组出现的总数构造了一组2×2矩阵来表示序列.进一步,我们计算这 种压缩矩阵的最大特征值并把它作为DNA序列的一种不变量.基于这些DNA序列的不 白(globin)基因序列的第一个外显子序列的相似性和非相似性;另外,我们试图通过比较 特征序列来找出嘌呤.嘧啶。酮基一氨基,弱氢键.强氢键分类可能显现出的生物功能. 第二章研究DNA序列的特征序列在基因识别算法中的应用。首先,我们给出DNA 序列的特征序列的一种数值刻划.利用这种数值刻划给出一个基因识别算法,并将这种 算法用在模式生物酿酒酵母菌基因组的分类数据库中,准确性超过95%.反过来将算法 应用到酿酒酵母菌基因组中进行基因识别,得到了一个酿酒酵母菌基因组申基因总数的 估计5897,与普遍接受的酿酒酵母菌基因组中基因数目5800-6000相符. 在第三章,我们将DNA序列的特征序列推广到蛋白质序列中.根据20种氨基酸的 物理化学性质,给出一种蛋白质序列的特征序列的概念来表示氨基酸的疏水性质和电价 性质,并给出蛋白质序列的特征序列一种数值刻划.然后,通过比较这些特征序列的数 值刻划得到一些蛋白质二级结构类全。螺旋,全卢折叠。和叩类蛋白质的一些关于疏 水性质和电价性质的信息. 在最后一章,我们利用代数的方法分析DNA序列和它们的三维图表示.首先,我 们给出DNA序列的三维图表示(DNA曲线)的一些代数的运算,并用对称群作用到 DNA曲线上,从而得到DNA曲线的一些性质.其次,对于DNA曲线,我们定义了两种 等价关系,并得到一些与这两种等价关系相关的计数公式.在这一章的最后我们证明一 个与等价类的熵有关的不等式. 关键词:生物信息学、DNA序列、特征序列、蛋白质、蛋白质二级结构类、基因 组、基因识别算法、压缩矩阵、特征序列的数值刻划。 Abstract areallmacromolecules protein DNA(deoxyribonucleicacid),RNA(ribonucleicacid),and units.Inthe are whichal-eunbranchedbuiltfromsmaller caseof units polymersup DNA,these the for fournucleotideresidues A(adenh:le),C(Cytosine),G(guanine)andT(thymine)while arethefour and theunits units nuoleotideresidues RNA,the A,c,G proteinl

文档评论(0)

1亿VIP精品文档

相关文档