再谈最长公共子串问题.docVIP

  • 3
  • 0
  • 约7.89千字
  • 约 12页
  • 2018-10-12 发布于江苏
  • 举报
再谈最长公共子串问题

再谈最长公共子串问题 作者:寒雨疏桐 文章来源:网易 点击数:1049 更新时间:12/30/2003 ????最长公共子串(Longest?common?substring,?简称LCS)问题指的是求出给定的一组字符串的长度最大的共有的子字符串。 ????举例说明,以下三个字符串的LCS就是?cde: ????abcde? ????cdef? ????ccde ????? ????高效的查找LCS算法可以用于比较多篇文章的最长相同片段,以及生物学上的基因比较等实际应用。 ????前几天写了一个穷举法的简单实现,感觉在数据量稍大时效率极低,所以今天上网查了一些资料,找到了解决LCS问题的最佳算法并编程实现,程序效率得到了极大的提高。 ????采用的是广义后缀树(Generalized?Suffix?Tree,简称GST)算法,就是把给定的N个源字符串的所有的后缀建成一颗树,这个树有以下一些特点: ????1.树的每个节点是一个字符串,树根是空字符串“” ????2.任意一个后缀子串都可以由一条从根开始的路径表达 ?????(将这条路径上的节点字符串依次拼接起来就可以得到这个后缀) ????3.特别应注意任意一个子串都可以看作某一个后缀的前缀。既然每一个后缀 ??????都可以由一条从根开始的路径表达,那么我们可以从根节点开始一个字符 ??????一个字

文档评论(0)

1亿VIP精品文档

相关文档