字符串的有关算法.ppt

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
字符串的相关算法 还是在前面的话 因为本人太弱…所以这几天讲的ppt经常会发现错误,建议在ppt大略的基础上去找相关论文学习。 可能重点还是在原理的简单解释… 有的地方听不懂的话也没关系,因为每个人没有实现过代码之前实际上都是这样的,可能会对某些地方不理解不影响你对整个算法的印象。以后如果能够专门思考的话也许就会快捷许多。 字符串算法有一些的原理看起来比较麻烦,但是代码量往往特别短,所以建议要去完全理解某个算法的原理,这样子以后就算把模板忘了,也许也能够通过原理写出相应的代码。 一开始可以学习一下练习模板。字符串算法的模板往往很短,很容易上手。 大前天提到了分治… 提到了这样一个方程… f(n)=f(n/2)+f(n/2)+O(1) 这个咱当时是说f(n)=O(nlogn) 那是咱SB… Too Na?ve 考虑线段树的节点,就是这个分布的… 可是线段树的节点个数是O(n)的 这个的解显然应该是f(n)=O(n) 在此表示歉意 咱所知道的字符串算法 Pascal的Pos函数… Hash哈希 Kmp和扩展Kmp Trie树 AC自动机 后缀树,后缀数组(SA),后缀自动机(SAM) Manacher算法 乱搞 最近新出来的:回文自动机(PAM)(太弱不会)。 Hash哈希 Hash应该都知道… 常用的Hash函数? 首先直接把每一个字符的ASCII值加起来作为Hash值不取模的情况很容易冲突… 常用的Hash,自己设一个X进制(X=你的字符集的大小-1,比如大写字母有26个字母,字符集大小为26) 然后咱们就有 Hash=∑S[i]*X^(i-1) 假设字符串长度为s,这个就可以在O(s)的时间内算出来。 显然如果存的下最后的Hash值的话,每一个字符串的Hash值必定不相同。 Q:为什么? 实际上这种计算方法,每个字符串都是X进制下的一个数,而Hash值就是这个X进制的数转十进制的值,由于X进制的数互不相同,显然Hash值,即十进制的数也互不相同。 Q:那如果字符串长度过大,以致会爆怎么办? 取个模呗… Q:那如果两个字符串不同Hash值取某个模最后相同怎么办? 取多个模呗…如果多个模的情况下都相同那么就是同一个字符串。 Q:如果取多个模都相同呢? …… 首先,这个模是你自己定的,所以一般数据是没办法全部卡的。接着,由中国剩余定理,只要取到的每个模足够大,那么最后也可以保证一定范围内的Hash值是一定的。 Q:中国剩余定理是什么? 以后讲数学的时候会讲吧…顺便可以百度_(:зゝ∠)_ 除了这种Hash以外,字符串Hash也有很多其他的版本,比如ELFhash(黑书上的) 据说这个的效果比上面的还好,咱没试过_(:зゝ∠)_ Function ELFhash(var s:string):integer; Var g,h,i:longint; Begin h:=0; for i:=1 to length(s) do begin h:=h shl 4+Ord(S[i]); g:=h and $f0000000 ($是十六进制) if g0 then h:=h xor (g shr 24); h:=h and (not g); end; ELFhash:=h mod M; End; Bzoj1014 JSOI2008 火星人 火星人最近研究了一种操作:求一个字串两个后缀的公共前缀。 比方说,有这样一个字符串:madamimadam,我们将这个字符串的各个字符予以标号:序号: 1 2 3 4 5 6 7 8 9 10 11 字符 m a d a m i m a d a m 现在,火星人定义了一个函数LCQ(x, y),表示:该字符串中第x个字符开始的字串,与该字符串中第y个字符开始的字串,两个字串的公共前缀的长度。 比方说,LCQ(1, 7) = 5, LCQ(2, 10) = 1, LCQ(4, 7) = 0 在研究LCQ函数的过程中,火星人发现了这样的一个关联:如果把该字符串的所有后缀排好序,就可以很快地求出LCQ函数的值;同样,如果求出了LCQ函数的值,也可以很快地将该字符串的后缀排好序。 尽管火星人聪明地找到了求取LCQ函数的快速算法,但不甘心认输的地球人又给火星人出了个难题:在求取LCQ函数的同时,还可以改变字符串本身。 具体地说,可以更改字符串中某一个字符的值,也可以在字符串中的某一个位置插入一个字符。地球人想考验一下,在如此复杂的问题中,火星人是否还能够做到很快地求取LCQ函数的值。字符串

文档评论(0)

diquefaw + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档