字符串处理和STL.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
字符串处理和STL

字典树 int main() { char temp[11]; int i,j; root=(struct dictree *)malloc(sizeof(struct dictree)); //建立根节点 for(i=0;i26;i++) root-child[i]=NULL; while(gets(temp),strcmp(temp,)!=0) insert(temp); while(scanf(%s,temp)!=EOF) { i=find(temp); printf(%d\n,i); } } 匹配算法之KMP——串的模式匹配算法 朴素模式匹配算法(Brute-Force算法) 求子串位置的定位函数Index( S, T, pos). 模式匹配:子串的定位操作通常称作串的模式匹配。 目标串:主串S。 模式串:子串T。 匹配成功:若存在T的每个字符依次和S中的一个连续字符序列相等,则称匹配成功。返回T中第一个字符在S中的位置。 匹配不成功:返回0。 Brute-Force Brute-Force简称为BF算法,亦称简单匹配算法。 其基本思路是: 从目标串s=“s1s2…sn的第一个字符开始和模式串t=“t1t2…tm中的第一个字符比较,若相等,则继续逐个比较后续字符;否则从目标串s的第二个字符开始重新与模式串t的第一个字符进行比较。依次类推,若从模式串s的第i个字符开始,每个字符依次和目标串t中的对应字符相等,则匹配成功,该算法返回i;否则,匹配失败,函数返回0。 例如,设目标串s=“cddcdc”,模式串t=“cdc”。s的长度为n(n=6),t的长度为m(m=3)。用指针i指示目标串s的当前比较字符位置,用指针j指示模式串t的当前比较字符位置。BF模式匹配过程如下所示。 BF算法的时间复杂度 主串长n; 子串长m。可能匹配成功的位置(1 ~ n-m+1)。 ①最好的情况下, 第i个位置匹配成功,比较了(i-1+m)次, 最好情况下算法的平均时间复杂度O(n+m)。 ②最坏的情况下, 第i个位置匹配成功,比较了(i*m)次, 设nm,最坏情况下的平均时间复杂度为O(n*m)。 改进算法-KMP算法 因p1≠p2,s2=p2,必有s2≠p1,又因p1=p3,s3=p3,所以必有s3=p1。因此,第二次匹配可直接从i=4, j=2开始。 KMP算法是D.E.Knuth、J.H.Morris和V.R.Pratt共同提出的,简称KMP算法。该算法较BF算法有较大改进,主要是消除了主串指针的回溯,从而使算法效率有了某种程度的提高。 改进: 每趟匹配过程中出现字符比较不等时,不回溯主指针i,利用已得到的“部分匹配”结果将模式向右滑动尽可能远的一段距离,继续进行比较 为此,定义next[]数组,next[j]的值表示P[0...j-1]中最长后缀的长度等于相同字符序列的前缀。 max{ k|0kj,且“p0…pk-1”=“pj-k+1…pj-1” } 当此集合非空时 -1 当j=0时 0 其他情况 next[j]= 如何求next[]值? 按照递推的思想: 根据定义next[0]=-1,假设next[j]=k, 即P[0...k-1]==P[j-k,j-1] ?? 1)若P[j]==P[k],则有P[0..k]==P[j-k+1,j],很显然,next[j+1]=next[j]+1=k+1; ?? 2)若P[j]!=P[k],则可以把其看做模式匹配的问题,即匹配失败的时候,k值如何移动,显然k=next[k]。 void getnext(char *src, int m, int *next){ int i=0,j=-1; next[0]=j; while(im){ while(j!=-1 src[j] != src[i]) j= next[j]; i++,j++; if(j=m) next[i]= next[j-1]; else next[i]=j; } } 小结: 1、kmp算法是一种快速的模式匹配算法 2、kmp的核心是next数组 3、复杂度为O(n+m) 4、解决的问题有:短串是否在长串中出现及首次匹配到的位置、短串在长串中出现的次数等 牛刀小试 poj 3461 任何一种算法运用的巧妙

文档评论(0)

80219pm + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档