生物资讯相关演算法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Na?ve algorithm build suffix tree for B; for L = |A| downto 1 do for i = 1 to |A|-L+1 do { if A[i…i+L-1] occurs in B { output A[i…i+L-1] and halt; } } } output “no common substring”; Time complexity? 2003/10/21 * * 第三十页,共五十四页。 O(|A|3+|B|) ( ) 3 | | 1 2 | | 1 | | 1 | | | | | | ) ( ) 1 | (| A O A i i A O i O i A A L A L A L = ? ? ? ? è ? + - = + - = ? ? ? = = = ? The for-loop takes time Can we do better than this? 2003/10/21 * * 第三十一页,共五十四页。 A faster algorithm build suffix tree for B; for i = 1 to |A| do { find the largest integer L(i) such that A[i…i+L(i)-1] occurs in B by binary search; } output A[i…L(i)] for the i with the largest L(i); Time complexity? 2003/10/21 * * 第三十二页,共五十四页。 O(|A|2 log|A|+|B|) The for-loop takes O(|A|2 log|A|) time. Each binary search takes time O(|A| log |A|). There are overall O(|A|) binary searches. Can we do better than this? 2003/10/21 * * 第三十三页,共五十四页。 Donald E. Knuth conjectured in 1970 that … it is impossible to solve this longest common substring problem in O(|A|+|B|) time. 2003/10/21 * * 第三十四页,共五十四页。 Longest Common Substring in O(|A|+|B|) time via suffix tree 2003/10/21 * * 第三十五页,共五十四页。 Idea Construct a suffix tree T for A#B$, where # and $ are two characters not in A and B. There are exactly |A|+|B|+2 leaves in T, each leaf corresponds to a suffix of A#B$. A-leaf: with label in {1, 2, …, |A|} corresponds to an A-suffix. B-leaf: with label in {|A|+2, …,|A|+|B|+1} corresponds to a B-suffix. $ # A B A-suffix B-suffix 2003/10/21 * * 第三十六页,共五十四页。 Observation Let v be an arbitrary position of T (i.e., v is not necessarily a node of T.) v has a descendant A-leaf if and only if v corresponds to a prefix of an A-suffix of A#B$. v has a descendant B-leaf if and only if v corresponds to a prefix of a B-suffix of A#B$. root v 2003/10/21 * * 第三十七页,共五十四页。 Lemma Let v be a position of T. v has descendant A-leaf and B-suffix if and only if v corresponds to a common substring of A and B. root $ # A B A-suffi

文档评论(0)

虾虾教育 + 关注
官方认证
文档贡献者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档