(中文文章.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(中文文章

文摘 我们连续基准测试方法 RNA二级结构的评估predic-tion CompaRNA网络中实现的方法 服务器。截至2012年10月3日,28岁的性能 单序列和13比较方法 评估在RNA序列/结构 每周发布的蛋白质数据银行。我们也 提供一个静态基准生成RNA 2 d 结构来源于RNAstrand数据库。 基准数据集提供洞察 相对性能的RNA二级结构pre-diction RNA的方法和不同的大小 对不同类型的结构。根据 我们的测试中,最准确的平均predic-tions通过比较的方法 由CentroidAlifold、MXScarna RNAalifold 和TurboFold。平均来说,最准确的 单序列获得的预测分析 由CentroidFold生成,ContextFold和 IPknot。最好的比较方法通常表现最好的如果一个单序列的方法 同源RNA序列的一致性是可用的。本文介绍了作为结果截至2012年10月3日,而排名 提出了在线不断更新。我们将 欣然包括新的预测方法和新的 新版本的准确性的措施 CompaRNA基准。 介绍 核糖核酸(RNA)分子起着至关重要的作用 生物体;在他们的许多其他功能, 他们是遗传信息的携带者,监管机构 基因表达和代谢反应的催化剂。 RNA分子形成复杂的结构(1);他们的线性 核苷酸序列直接确定的模式 碱基对(二级结构),进而确定 全球形状(三级结构)。空间结构 RNA分子的又一个重要的决定因素 与其他分子的相互作用的细胞, 因此,其细胞功能。RNA second-ary结构的分析其功能是一个重要的一步 鉴定。 对于大多数RNA序列,没有实验数据 结构是可用的。为了克服这个问题, 大量的计算预测的工具 RNA二级结构的序列 (2)开发的。两个主要的家庭计划 区别:单序列和比较方法。 一个流行的计算方法预测RNA 结构从单一序列依赖的假设 ,本机的RNA结构 最小自由能(MFE)。预测通常是 通过计算所有可能的组合 碱基对,使用动态的实现方法 编程,所确定的性质和guar-antee发现自由能最低的(如结构。 如RNAfold(3)]。然而,MFE结构并不 一定是生物功能, “真正”的结构可能对应于一个较低的,但不是 最低的能源。这也是有关事实 MFE可以改变在不同环境(如pH值、 溶剂条件等等),MFE计算 本身是简化。此外,折叠的RNA序列 在细胞环境中不仅可以决定的 热力学也由动力学,它也可以 首先取决于哪些核苷酸转录。因此, 方法开发了预测不仅MFE之一 结构,但对于一个给定的一组低能量结构 RNA序列(如。为实现RNAsubopt(3)]。 也是一个挑战与探索所有可能的 一个给定的RNA分子的构象是RNA 1.8 lengthncan形式 N 可能的二级结构。 例如,一个长100 nt RNA序列可以theoretic-ally形式10 25 二级结构。如果10000年的能源 结构计算中经常1 s处理器, 所有的计算结构将require10 13 年 (2),已经进行了各种尝试减少的com-plexity RNA折叠问题的基础 形状抽象,RNA结构树状地图形状。它已被证实的作者 RNAshapes程序,这种方法是可行的 集成和动态编程的com-plexity(4)。RNA折叠问题也往往减少 通过引入启发式识别结构 可能是生物相关。heur-istic方法的一个变体是样本结构从玻耳兹曼 系综(5、6)来确定大型集群类似second-ary结构(理想)的能量较低。 另一类方法推断预测的基础上 进化方面的考虑。他们需要一个多个 对齐的RNA序列同源 查询(相关从共同祖先血统)。 有尝试使用其他方法包括 这两种方法的结合前面所讨论的 文本,例如RNAalifold结合比较pre-diction结构的最小自由能计算 一组序列对齐(7)。 一个问题是,可用的方法 二级结构预测是最准确的 和特殊的软件实现 实际上最有用的(即生成合理pre-dictions任何RNA查询序列)。在本文中,我们 比较单序列和比较的方法 RNA二级结构预测。的第一个 试图比较方法预测的准确性 RNA二级结构是由加德纳和 Giegerich(8),专注于比较方法。 马修斯相关系数(MCC)被用作 主要描述方法的性能指标。 最近,Xuet。(9)预测的性能进行测试 在两个单独的数据集:一个由一只se-quences和其他5 s rRNA序列。他们 强调选择的序列作为数据集强烈影响的方法 因为不同的程序可能在differ-ent表现更好的家庭序列;因此,基准数据集 应调整为不同类型的任务和场景吗 特定的程序可以应用。也 最近,Hajiaghayiet。(10)的性能进行了测试 能源RNA二级结构的算法 预测,包括MFE和MEA(

文档评论(0)

wu12youli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档