RNA二级结构预测汇.docVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
RNA二级结构预测汇

专业:应用数学 学号:6121202010 姓名:朱婵 RNA二级结构的预测 随着对RNA的研究的逐步深入,人们不仅仅把RNA看成DNA到蛋白质之间的一种信息传递中介,RNA逐渐在中心法则中取得了与DNA和蛋白质同等重要的地位,研究它更可以作为研究蛋白质结构与功能以及DNA序列中基因信息的突破口, RNA结构同蛋白质类似,也具有一级结构,二级结构,三级结构甚至四级结构等形式。 一级结构:是指RNA序列中四种核苷酸的不同排列顺序。 二级结构:是指RNA序列通过自身回折形成碱基配对的茎区以及不配对的发卡环,凸环,多分支环等等。 三级结构:是指由各二级结构单元之间相互作用并且在空间中形成稳定的定位和取向而构成的。 RNA是由A,C,G,U四种核苷酸组成的单链。RNA的单链性质导致它与DNA不同,分子中的一部分核苷酸可与其他部分的核苷酸互补配对,即RNA分子可产生折叠。而且,核苷酸序列唯一决定了分子折叠的方式,这也是我们分析核苷酸序列预测分子结构的依据。对于当前的预测方法,真正的三维结构还是过于复杂,所以我们主要专注于二级机构的预测。实际上是试图确定哪一些碱基相互配对。 我们可以把RNA分子看做是n个字符的串。,n为几百至几千。 分子的二级结构是碱基对的集合。互补,且。 例1: 例2: 例2是一种叫做结的自然构象。当,且时,存在结。没有结就变为平面图。结在RNA分子中确实存在,而排除结可简化问题。排除结的另一个理由是,二级结构可用于预测三维结构,而结可在后一阶段再予以考虑。 当没有任何先验知识,只给定了RNA的一级序列时,预测RNA的二级结构一般采用最小自由能模型。给模型假定真实的RNA会折叠成一个具有最小自由能的二级机构。 因为碱基配对的形成可以使分子的能量降低,结构更加稳定,因此最小自由能算法被认为在一定温度下,RNA分子通过构象调整达到某种热力学平衡,使之自由能达到最小,形成最稳定的状态,此时的二级结构即被认为是RNA的真实二级结构。 其基本思想是针对各种不同的RNA基本机构单元并根据不同碱基组成,分别用实验方法测出它们的自由能,建立起一张完整的自由能参数表,假设这些基本结构单元的自由能具有可加性和相对独立性,也就是说一个二级结构的自由能是组成它的各基本结构单元的自由能之和且这些自由能之间是互不影响互不关联的。然后根据公式再算出总体能量全局最小值。 独立的碱基对: 前提:假设在所有的RNA结构中碱基对的能量是相互独立的。 则结构的总自由能可定为:。 为碱基对的自由能。 约定 例3: 当不配对,则; 当配对,则; 当与某个配对, 若无结,则。 因此,问题变成 上述等式可以写成: 此算法的运行时间为。 有环的结构 前提:放宽对碱基对自由能彼此独立的假设,认为碱基对的自由能依赖于相邻碱基对。 需要考虑RNA的环结构。 假定中有碱基对,考虑位置若对任何和碱基对都不是中的碱基对,则碱基是从可达的。环是碱基对可达的所有碱基的集合。 下图显示了各种不同类型的环。 (a)发卡环 (b)凸环 (c)内环 (d)螺旋区域 环的大小是其所含的不配对碱基的个数。 一些结构的出现与否自由能具有影响。 例:(1)螺旋区域具有负的(稳定的)自由能。 (2)大于0的环有正的(不稳定的)自由能。 当时闭锁一个环的碱基对时,可能不是的最小自由能结构。即可能存在低于自由能把碱基对加到时,稳定的自由能可能会反超。 相对于完全一般的环模型,这些递归关系仍包含了若干的简化,这些简化对产生更有效的动态程序设计算法是有必要的。 第一个简化:不考虑不属于任何环的碱基的自由能。 第二个简化:结构的总自由能是各组分自由能简单累加之和。 第三个简化:仅考虑上图中的各种环 则 。 由下列自由能函数 大小为的发夹环的不稳定的自由能 相邻碱基对的稳定自由能 大小为的凸的不稳定自由能 大小为的内环的不稳定自由能 用上面的函数,可得的递归关系式: 若是发夹环 运行时间; 若是螺旋结构 运行时间; 若是位的凸 运行时间; 若是位的凸 运行时间; 若是内环 运行时间。 由上,我们可以清楚的看出计算内环耗费时间最多。 我们可以使运行时间降低到。 如果仔细审视所用的各种自由能函数,运行时间还可以进一步改善,类似于第三章中的空隙罚分函数计算时间的改善。需要指出的黑丝,对于线性不稳定函数,上述的运行时间可进一步优化到(对于内环和凸)。

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档