logo

您所在位置网站首页 > 海量文档  > 办公文档 > PPT模板

后缀自动机-2012年noi冬令营陈立杰讲稿.ppt 57页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
V:SPOJ LCS 我们考虑用SAM读入字符串B。 令当前状态为s,同时最大匹配长度为len 我们读入字符x。如果s有标号为x的边, 那么s=trans(s,x),len = len+1 否则我们找到s的第一个祖先a,它有标号为x的边,令 s=trans(a,x),len=Max(a)+1。 如果没有这样的祖先,那么令s=root,len=0。 在过程中更新状态的最大匹配长度 V:SPOJ LCS 注意到我们求的是对于任意一个Right集合中的r,最大的匹配长度。那么对于一个状态s,它的结果自然也可以作为它Parent的结果,我们可以从底到上更新一遍。 然后问题就解决了。 VI:SPOJ LCS2 一些其他的东西 其实不仅仅有Suffix Automaton还有。。 Factor Automaton Suffix Oracle Factor Oracle Suffix Cactus Oracle的意思是神谕!听起来很强吧。 Factor Oracle 一个串的Factor Oracle是一个自动机,可以识别这个串的所有子串的集合,但也可以识别一些别的乱七八糟的东西。 其实Oracle也有预言的意思,所以这个是不一定准的。 Factor Oracle的构造算法非常的简单,不过我也不知道这个在OI中有什么用,就不讲了。 广告 我会把课件和代码放在我的博客上,地址是: /wjbzbmr/ 我们需要新的算法来解决这个问题 在SPOJ的讨论版中,出题人提到了要使用suffix automaton来解决此题。 * 提到字符串数据结构,大家都会想到这些 * 了解AC自动机的同学都不会陌生, * * 如果时间复杂度达到N^2级别,这个数据结构也就没有意义了。 演示插入的过程。 * * 说了这么多,如果不能给出一个构造SAM的算法,也没有意义。 * 状态数的线性证明 状态数的线性证明 状态数的线性证明 一些性质 一些性质 关于子串的性质 由于每个子串都必然包含在SAM的某个状态里。 那么一个字符串s是S的子串,当且仅当,ST(s)!=null 那么我们就可以用SAM来解决子串判定问题。 同时也可以求出这个子串的出现个数,就是所在状态Right集合的大小。 关于子串的性质 在一个状态中直接保存Right集合会消耗过多的空间,我们可以发现状态的Right就是它Parent树中所有孩子Right集合的并集,进一步的话,就是Parent树中它所有后代中叶子节点的Right集合的并集。 那么如果按dfs序排列,一个状态的right集合就是一段连续的区间中的叶子节点的Right集合的并集,那么我们也就可以快速求出一个子串的所有出现位置了。 树的dfs序列:所有子树中节点组成一个区间。 线性构造算法 我们的构造算法是Online的,也就是从左到右逐个添加字符串中的字符。依次构造SAM。 这个算法实现相比后缀树来说要简单很多,尽管可能不是非常好理解。 让我们先回顾一下性质 定义和性质的回顾 状态s,转移trans,初始状态init,结束状态集合end。 母串S,S的后缀自动机SAM(Suffix Automaton的缩写)。 Right(str)表示str在母串S中所有出现的结束位置集合。 一个状态s表示的所有子串Right集合相同,为Right(s)。 Parent(s)表示使得Right(s)是Right(x)的真子集,并且Right(x)的大小最小的状态x。 Parent函数可以表示一个树形结构。不妨叫它Parent树。 定义的回顾 一个Right集合和一个长度定义了一个子串。 对于状态s,使得Right(s)合法的子串长度是一个区间,为| [Min(s),Max(s)] Max(Parent(s)) = Min(s)-1。 SMA的状态数量和边的数量,都是O(N)的。 不妨令trans(s,ch)==null表示从s出发没有标号为ch的边, 定义的回顾 每个阶段 每个阶段 每个阶段 每个阶段 每个阶段 每个阶段 每个阶段 接下来考虑节点nq,在转移的过程中,结束位置L+1是不起作用的,所以trans(nq)就跟原来的trans(q)是一样的,拷贝即可。 每个阶段 每个阶段 自此我们圆满的解决了转移的问题。 嘟嘟噜,搞完啦~~ 每个阶段:回顾 每个阶段:回顾 否则新建节点nq,trans(nq,*)=trans(q,*) Parent(nq) = Parent(q) (先前的) Parent(q) = nq Parent(np)=nq 对所有trans(v,x) == q的p的祖先v,t

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

“原创力文档”前称为“文档投稿赚钱网”,本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。原创力文档是网络服务平台方,若您的权利被侵害,侵权客服QQ:3005833200 电话:19940600175 欢迎举报,上传者QQ群:784321556