- 26
- 0
- 约1.66万字
- 约 20页
- 2016-03-01 发布于重庆
- 举报
7.3 RNA二级结构的预测
7.2.7 综合方法
实际应用中最常见的综合方法是同时使用多个软件进行预测,通过分析各个软件的特点以及各个软件预测结果,最终形成二级结构一致性的预测结果。将序列比对与二级结构预测相结合也是一种常见的综合方法。
双重预测是另一类综合方法,该方法首先预测蛋白质的结构类型,然后根据不同结构类型蛋白质的二级结构形成规律预测新蛋白质的二级结构,并根据结构类型解释预测结果。
就像( 螺旋和(折叠片的位置可以预测出来一样,其它特定的结构或结构特征,如卷曲螺旋和跨膜区也可以预测出来。但这类预测的方法没有二级结构预测方法多,主要是由于这些结构或结构特征的折叠规律尚不十分清楚。尽管如此,若待预测序列在已知结构数据库中能搜索到相似蛋白,则可以提高预测的准确性。
早期人们建立的多种二级结构的预测方法,都是建立在假定蛋白质的二级结构主要是由局部氨基酸所决定,准确率都不超过65%。随着蛋白质进化信息、长程相互作用信息及全局信息的加入,蛋白质二级结构预测的准确率有了较大的提高。由于序列信息和结构信息的不断增长,通过统计得到的蛋白质序列与二级结构关系及规律更加全面,同时也由于预测方法的不断改进,使得蛋白质二级结构预测的准确率也在不断地提高,预测二级结构的准确率已经可以达到80%以上。一般认为,如果蛋白质二级结构预测准确率足够高的话,就可以基本准确地预测一个蛋白质分子的三维空间结构。但目前所取得的成果还难以达到这一目标。虽然二级结构的预测准确率还不能满足准确推测蛋白质分子三维空间结构的要求,但其预测结果仍能提供许多有用的结构信息,尤其当蛋白质的结构尚未解出时更是如此。通过对多种预测结果的综合分析,再结合光谱实验数据,往往可以提高预测的准确度。由于二级结构预测很好地反映了局域序列片段的结构倾向性,因此在进行全新蛋白质设计时,常根据二级结构预测结果来设计二级结构单元。
7.2.8 氨基酸残基之间的距离
只要给出所有残基之间的距离,就可以利用距离几何或分子动力学方法构建蛋白质的三维结构,这是核磁共振NMR
7.3 RNA二级结构的预测
DNA具有双螺旋结构,而RNA是单链结构。单链RNA的三维结构是由它的核苷酸序列决定的,这与蛋白质的结构由蛋白质的序列决定相类似。但是,RNA的结构并没有蛋白质的结构那么复杂。
RNA的结构可以分为三个层次,即一级结构、二级结构和空间结构。一级结构就是RNA的序列。二级结构是通过碱基互补配对而形成的,碱基对之间的氢键以及它们形成的螺旋堆积力起着稳定结构的作用,降低自由能。RNA的二级结构单元与蛋白质的二级结构单元很不一样。但在单链RNA中,由于配对的碱基出现在单个RNA分子中,因此就会形成碱基配对的茎区(stem region)。在RNA链中,为了形成这种碱基配对,需要反转链的方向,于是在反转处就会形成一个发夹环。如果RNA链上有很少的碱基没有相对应的互补碱基,那么就会形成一个小的突出部分或者形成一个较大的环状区(loop),即内环或者膨胀环。发夹环一般位于茎的末端,而内环或膨胀环使茎中断。图7.6是一个RNA的二级结构示意图,其中包括茎、发夹环、内环、膨胀环连续碱基配对等。
当RNA分子折叠时,有些碱基相互配对,形成螺旋区域或茎,这部分碱基具有负的自由能;而其它非互补的碱基处于自由态,形成单链或环,这部分碱基的自由能为正值。环区的存在使RNA分子的自由能升高,结构的稳定性减弱。因此,预测RNA二级结构的一种直接的方法是寻找最大数目的碱基配对。
通过确定常见RNA二级结构单元的位置,我们能够比较好地预测出RNA的结构。但是,伪结(pseudo knot)是RNA二级结构预测中最难预测的一种二级结构。在形成伪结的地方,环状区域内的碱基与环状区域外的碱基相互配对。由于伪结的预测比较困难,因此,许多早期的二级结构预测算法完全不考虑伪结,这些算法是在忽略伪结区域存在的前提下预测其它二级结构单元的。
可以用点矩阵作图的方法来寻找最大配对。将RNA的碱基序列顺序地排布在X轴上,对于配对的碱基在Y轴相同的位置打上点标记。设RNA序列的长度为n,根据序列建立一个n×n的矩阵R,如果第i个碱基与第j个碱基配对(如A(U、G(C),则 R[i,j]=1,否则为0。根据所得到的点矩阵图,可以找出最大配对。当然,这是一种非常简单粗糙的方法。
目前RNA二级结构预测有两种主要的方法,一是基于序列比较的方法,另一种方法是能量最小化方法。基于序列比较的方法主要是通过多重序列比对,根据相似序列具有相似结构的原理进行二级结构预测。
能量最小化方法在预测RNA分子二级结构时,试图对RNA折叠的自由能进行最小化,进而搜索最稳定的结构。该方法通过各种能量优化方法或者分子动力学计算评价所有可能配对的能量,进而发现具有最小能量的结构。Zuker的Mfold程序是使用较多的程序
您可能关注的文档
最近下载
- (正式版)C-J-T 3008.3-1993 城市排水流量堰槽测量标准巴歇尔水槽.docx VIP
- (新教材)2026年春期部编人教版二年级下册语文教学计划及进度表.pdf
- 冀教版小学二年级数学下册课件《认识分米、米》.ppt VIP
- 火灾事故现场处置应急演练记录.docx VIP
- 化工安全与环保(梁志武)课件 第一章 化工生产安全管理基础.pptx VIP
- 2025山东军转考试真题及答案.doc VIP
- 儿童早期矫正系统讲解.pptx VIP
- 地震应急预案(通用22篇).docx VIP
- (2025年)东南大学艺术设计专业考研真题附答案.docx VIP
- JJF(闽) 1145-2024 恒温振荡器校准规范.pdf VIP
原创力文档

文档评论(0)