多串匹配算法及启示.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
IOI2004 国家集训队论文 朱泽园 多串匹配算法及其启示 南京市外国语学校 朱泽园 [关键字] 模式串 单词前缀树 后缀树 串匹配 [摘要] 字符串处理在实际应用中具有重要地位,其看似简单,但随 着研究的深入,各类思想精华涌现其中,难度也变得深不可测。 因此信息学竞赛中常以字符串处理为题,锻炼选手的创新能力。 本 第一章提出问题并进行朴素的分析,第二、三、五章分 别介绍三个辅助算法:KMP 模式匹配算法、自创的单词前缀树算 法,以及后缀树算法。另外基于KMP 算法的核心思想,在第四章 中,面向“ 串匹配”问题提出一个线性算法。但本 并没有满 足于线性时间复杂度,接着在第六章提出了平均性能更好的算 法。最后第七章对算法的构思进行了剖析,并将这种思想方法上 升到理论高度。 第 1 页 共 23 页 IOI2004 国家集训队论文 朱泽园 [ 目录] §1 问题的提出 §1.1 问题描述 §1.2 最初想法 §2 Knuth-Morris-Pratt 算法 §2.1 定义 §2.2 模式串的前缀函数(Prefix Function) §2.3 kmp 主算法 §3 单词前缀树 §3.1 单词查找树(Trie)的定义 §3.2 单词树的建立 §3.3 前缀指针的定义 §3.4 前缀指针的生成 4 主算法一(线性算法) §4.1 kmp 算法的启发 §4.2 单词前缀树的使用及附加标记 §4.3 单词前缀树的时间复杂度 §4.4 主过程 §4.5 时空复杂度 §4.6 该算法的一些扩展 §5 后缀树和McCreight 算法 §5.1 数据结构 §5.2 一些定义 §5.3 建立后缀树(初步) §5.4 后缀链接 §5.5 建立后缀树 6 主算法二(平均性能更好的算法) §6.1 单词前缀树的使用和扩展 §6.2 后缀树的使用和扩展 §6.3 TreeA 和TreeB 上的两个函数 §6.4 主过程 §6.5 一个例子 §6.6 时间复杂度分析 §7 启示和总结 §7.1 算法分析 §7.2 启示 §7.3 总结 第 2 页 共 23 页 IOI2004 国家集训队论文 朱泽园 [正 ] §1 问题的提出 §1.1 问题描述 所谓多串匹配,就是 定一些模式串,在一段文章 (只出现小写 a 到 z 这 26 个字母)中,找出第一个出现的任意一个模式串的位置。具体来说就是: 定 m 个长度分别为 L 、L ……L 的模式串数组 P [1..L]、P [1..L]…… 1 2 m 1 1 2 2 P [1..L],假设正文为一个长度为n 的数组T[1..n],限定 m m L 100K, m 1000, n 900

文档评论(0)

山丹丹 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档