计算分子生物学中若干问题的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要 DNA、RNA和蛋白质的初级结构(或线性序列)都是由较小的单元组成的无分 枝的线性聚合体大分子。对于DNA,这些单元是A(腺嘌呤)、c(胞嘧啶)、G(鸟嘌 嘧啶)这4种核苷酸残基;对于蛋白质这些单元是20种氨基酸残基,即A(丙氨醐、 酸)和Y(酪氨酸).这样,一个DNA(R_NA)序列可以看作是在一个有四个字母的字母 的字。而RNA(DNA)二级结构是由自由基(free 成的,在一定程度上,RNA(DNA)二级结构经过处理后都可以转化为线性序列。 因此.组合学和统计学的工具和方法可以在研究生物序列和生物结构上发挥很大的作 用。同样我们可以用几何方法来表示生物序列和二级结构,几何拓扑和群论也发挥很 大作用。 本文的主要工作包括以下几个方面: 由于目前所有有关RNA二级结构的预测算法要预测出所有序列的二级结构仍然 很困难,在第二章我们就应用组合计数的技巧解决了有关RNA二级结构及其子结构 的计数问题,推广了Ms.Waterman等人f5—7,91的结果. 自由能是衡量最优结构的常用标准,在第三章我n]给出了算法用于计算RNA二 级结构(含假结)的最小自由能。 在第四章,我们给出了算法用于寻找mRNA序列和蛋白序列的最优局部对比和全 局对比,我们还解决了生物序列和生物结构的LCS问题。 在第五章,我们根据DNA序列中四种核苷酸A、G、C和T的化学结构分类, 给出了DNA序列一种符征表示,2种三维图形表示方法,一种二维图形表示和一种 四维表示,利用序列对应点的坐标构造距离矩阵和L/L矩阵。计算L/L矩阵的正规化 最大特征值相距离矩阵的平均频带宽度,并把它们作为DNA序列的一种不变量。基于 序列的相似性和非相似性。我们还根据20种氨基酸的化学性质分类,给出了氨基酸 序列的一种特征表示,提出了,x一独立成分和特征信息熵的概念,利用特征信息熵和 产-独立成分分别构造向量比较了几种动物的神经元基因序列。 在最后一章,根据RNA二级结构中自由基和基对的化学结构分类,我们自 RNA二级结构的一种三维图形表示,一种四维表示和一种7维表示,并构造型 阵和L/L矩阵,利用L/L矩阵的正规化最大特征值和结构不变量比较了9种* RNA.3二级结构的相似性。 关键词:DNA序列、特征序列、蛋白质、RNA二级结构、距离矩阵、L/J 、正规化最大特征值、序列不变量、结构不变量、最小自由能. Abstract The structuresof acid),and acid),RNA(ribonucleic primary DNA(deoxyribonuclcic smallerunits. unbrazlchedbuiltfrom whichare areallmacrolnolecules polynmrsup protein nucleotideresidues Inthecaseof unitsarethefour DNA,these residues for unitsarethefournucleotide G(guanine)and RNA.the A, T(thymine),while C、Gand unitsarcthe aminoacidresidues protein,the twenty A(alanine), U(uracil

文档评论(0)

ww88666 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档