概率算法求解模式匹配问题.docVIP

  • 8
  • 0
  • 约3.94千字
  • 约 6页
  • 2016-09-17 发布于北京
  • 举报
概率算法求解模式匹配问题.doc

概率算法求解模式匹配问题   摘要:在长度为N的主串S中查找是否存在长度为M的模式串T,叫模式匹配问题。对于N和M均非常大的情况,概率算法求解此问题的效率比朴素算法和KMP算法要高。通过比较两个长度均为M的串的关联数是否相同,来确定这两个串是否相同。如果某它们的关联数不同,则这两个串一定不同;如果它们的关联数相同,则它们不同的概率很小,可忽略认为它们相同,也可将它们按位比较以便准确判断它们是否相同。本文计算长度为M的串的关联数的算法复杂度为O(1)。   关键词:概率算法 模式匹配 关联数 主串 模式串 时间复杂度   中图分类号:TP312 文献标识码:A 文章编号:1007-9416(2013)05-0154-02   1 前言   给定的符号模式是否出现在是一个很长的文本中,通常将此问题称为模式匹配。分析DNA序列和其他各种基因相关项目的结果,涉及的算法学上的核心问题是模式匹配问题。求解模式匹配问题的常用算法有朴素算法和KMP算法。朴素算法的效率很低,时间复杂度为O(n*m)[1-5]。KMP算法仅当主串与模式间存在许多“部分匹配”的情况下才能显示出它的高效率O(n+m)[1-5]。本文使用概率算法求解模式匹配问题,此算法特别适用于模式串非常长的情形。   2 模式匹配问题的概率算法   2.1 算法的基本思想   模式匹配问题具体描述为,在长度为N的

文档评论(0)

1亿VIP精品文档

相关文档