Tandemeat查找方法比较*) - 20090418061315.pdfVIP

Tandemeat查找方法比较*) - 20090418061315.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Tandemeat查找方法比较*) - 20090418061315

维普资讯 计算机科学 2005Vo1.32№.10 Tandem repeat查找方法比较*) 徐恒字 王 镝 王国仁 郑若石 (东北大学信息科学与工程学院 沈阳110005) 摘 要 Tandemrepeat在基因组成和进化中起到非常重要的作用,查找和分析 Tandme repeat已经成为当前生物信 息学的一个前沿领域和研究焦点。目前在这一研究领域存在多美解决方法,主要有基于LZ分解技术的方法和最近 兴起的基于后缀树索引的方法。本文选取了两种时间复杂度达到O(nlogn)数量级的代表性的方法,对这两种方法进 行 了全面的综述,并对它们的性能进行了系统的比较和分析。 关键词 Tandemrepeat,LZ分解,后缀树 MethodsofFindingTandem RepeatinString XU Heng-Yu WANG Di WANGGuo-Ren ZHENG Ruo-Shi (ScI啪 lofInformationScience& Engineering,Northeastem University。Shenyang110005) Al~ract Tandem repeattakessuchanimportantroleingenecompositionna devolutionthatthesae~handna alysisof tandme repeathavebecomeoneofthefrontdomainnadresearchfocus.Therearemultiplemethodsinrecentworks, mainlyincludingtwomethod s.OneisbasedonLZdecomposition,na dtheotherisbasedonsuffixtreeindex.Thispa- persummarizethesetwoO(nlogn)methodsnadtakesathoroughnaalysisnadocmparisonoftheirperformance. Keywords Tnadme repeat,LZdeocmposition,Suffixtree 找方法也被采用了,但是都没有达到0(nlogn)甚至是线性的 1 引言 时间复杂度 [5]。而后有一些方法通过限制 atndme repeat的 2O世纪后期 ,生物科学技术迅猛发展,无论从数量上还 输出个数(仅输 出pri-mitiveatndme repeat),使算法 的复杂 是从质量上都极大地丰富了生物科学的数据资源。尤其是随 度达到 O(nlogn)[“引。如果一个 tandme repeat的模式a不 着基因测序技术 的快速发展以及人类基因组项 的启 能表示成任意其他的 atndemrepaet,则称其为 primitivetan- 动,人们对各种生物序列(包括 DNA、RNA、蛋 白质)的结构 dme repaet。 进行了非常深入的研究并得到了大量的测序结果。 目前在这一研究领域有多种 比较实用的查找方法,其中 对DNA序列的试验分析表明序列中含有大量的tandem 具有代表性的两类方法是基于 LZ(LempeLZiv)分解技术的 repeat,例如 ,在人类 DNA序列中tandemrepeat的片段在整 查找方法和基于后缀树索引结构的查找方法。本文详细介绍 个序列中的比例超过5O …。近年来对DNA序列中tandem 上面提到的这两类有代表性的方法 ,分别实现了这两种算法, repeat的分析试验表 明tnadme repeat在基因组成和进化中 并在实验结果的基础上对它们作出了性能分析和比较。 起到非常重要 的作用Is,4],同时它是产生多种疾病 的病

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档