- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
带假结RNA二级结构的预测算法研究进展.doc
带假结RNA二级结构的预测算法研究进展
【摘 要】假结是RNA分子结构中一类特殊三级结构且决定多种生物功能。早期的RNA结构预测算法为简化操作多避开假结仅研究二级结构,降低了预测结果的精确度。随着算法研究的逐步成熟,假结研究成为预测重点。文中介绍了近几年提出的四类带假结的RNA二级结构预测算法,通过对算法效率及精确度的比较展望了未来算法的发展方向。
【关键词】RNA二级结构;假结;自由能;启发式算法
上世纪八十年代Pleij与Kolk等人在对几种毒菌RNA分子的结构分析中,证实了假结作为一类复杂而稳定的RNA结构广泛存在于多种生物细胞中,是实现其功能的重要因素,如端粒酶RNA分子的活性取决于其假结结构、某些病毒细胞利用假结结构模仿宿主的tRNA分子入侵生物体[1]。因此,要分析RNA分子的真实结构,假结预测是必须解决的问题。为提高假结预测的准确性,1990年Pleij利用数学方法提出了14种理论上存在的RNA假结结构,并利用弧图进行了分析和归纳。2009年刘元宁等人在Pleij的基础上利用平面图对假结结构的表示法进行了改进[2]。由于假结种类繁多、结构复杂,在RNA二级结构研究早期假结预测就已被证明为NP-hard问题,经过对预测算法的不断完善,目前也只有发夹环与单链形成的H型假结可被精确预测 [3]。本文将重点介绍最新提出的几类带假结RNA二级结构预测算法,再对其预测精度、复杂度和假结预测能力进行比较,最后还将展望未来预测算法的发展方向。
1.预测算法
针对待测序列本身以自由能为评判标准,利用计算机算法预测可能的RNA二级结构,是目前预测算法的主要发展方向,本部分将介绍四类带假结的RNA二级结构预测算法。
1.1 基于动态权重匹配的RNA折叠算法
2008年陆健和刘海军等人提出基于动态权重匹配的RNA折叠算法(Dynamic Weighted Matching,DWM),该算法在重大权重匹配算法的基础上引入了与茎区长度相关的动态权重,并结合碱基配对的固定权重作为茎区筛选的检验标准,通过茎区优化组合的方式预测出包含假结的RNA二级结构[4]。在DWM算法中将动态权重和固定权重合称为复合权重,若给定一段茎区S(i,j,k),则其计算公式(1)如下:
其中,第一项是配对碱基的固定权重之和,第二项为动态权重,其值由三类碱基配对的平均权重与茎区长度的平方根之积确定。DWM算法的运行流程是:首先在序列R=r1r2…rn中找出具有最大权重的茎区S(i,j,k),该茎区将序列分为三部分即:单链区L1(1,i),茎区S(i,j,k),单链区L2(j,n);然后分别L1、L2中搜索最大权重和茎区,如此递归搜索下去,直到序列首尾处的单链都不再具备形成茎区的条件为止;最后,再对第一次划分得到的单链L1,L2中尚未配对的碱基进行联合搜索,当搜索到最大权重茎区后再对剩余段继续递归搜索。该算法利用RNA回折规律,优先考虑短程碱基之间的配对,通过逐步搜索简化了自由能计算及算法复杂度,并且大幅提高了算法预测假结的能力。仿真实验结果表明,由于优先考虑短程碱基配对,DWM算法可以有效预测出tRNA序列的二级结构及假结,但针对非编码的RNA序列的预测效果则不理想[4]。
1.2 RnaPredict算法
RnaPredict算法是由Wiese等人于2002年提出的一类基于进化算法的RNA二级结构预测算法,其核心内容是利用十进制编码为初始种群中的单元结构(一个茎区及其顶端的发夹环)分配序号,然后利用选择、交叉、变异算子对结构集进行逐代优化,最终具备最小自由能的结构集即为预测到的RNA二级结构[5]。其后,Wiese等人对该算法进行了改进,2005年在文献[6]中尝试研究利用并行遗传算法提高计算效率,解决长链RNA序列的二级结构预测问题;2008年在文献[7]中对热力学模型进行了改进,提出了最近邻居模型(Individual Nearest Neighbor Model,INN)和最近邻居氢键模型(Individual Nearest Neighbor Hydrogen Bond Model,INN-HB),这两类模型额外考虑了各类碱基对组合对茎区稳定性的影响,以及不同碱基间形成的氢键对自由能的贡献;2009年在文献[8]中结合HotKnots的假结热力学模型利用进化算法尝试预测含假结的RNA二级结构并取得良好效果;2010年在文献[9]中将退火模拟算法与遗传算法相结合推
1.3 ProbKnot算法
2010年Bellaousov和Mathews等人提出了基于碱基配对概率的ProbKnot算法,该算法能够预测任意类型的假结,且时间复杂度仅为O(n2) [10]。算法原理是:首先利用机器学
您可能关注的文档
最近下载
- 一体机-柯尼卡美能达-bizhubC220说明书.pdf VIP
- BS EN 60079-32-2-2015 国外国际规范.pdf VIP
- 急诊科患者转运途中突然病情变化应急预案.pptx VIP
- G30连云港至霍尔果斯高速景家口至清水驿段扩容改造报告书.pdf VIP
- 股骨粗隆间骨折护理查房——护理问题及措施与健康指导.ppt VIP
- 零星工程 投标方案(技术方案).docx
- 一种比色法检测金黄色葡萄球菌活菌的Cu-MOF材料及其制备方法和应用.pdf VIP
- 中国农业银行超柜业务及账户管理相关知识考试试卷.docx VIP
- 第三章第一节SOLAS公约 - 青岛远洋船员职业学院-精品课程 ....ppt VIP
- 小学田径教学教案全集.docx VIP
文档评论(0)