KMP算法在正则文法中应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
KMP算法在正则文法中应用

KMP算法在正则文法中应用   摘 要:KMP又被称作克努特——莫里斯——普拉特操作(简称KMP算法)它是一种模式匹配算法,这个算法的关键是根据给定的模式串W1,m,定义一个next函数。本文阐述了利用KMP算法的匹配思想,解决不包含莫字符串系列的正则文法,该正则文法主要是用在词法分析过程中找出程序中的错误的代码,且对应的自动机中无等价的状态。本文根据KMP、正则文法和自动机的定义和基本原理证明了此技术的可行性和正确性,为编译程序设计提供自动生成最小化正则文法的技术和实现程序以供参考。   关键词:KMP算法;正则文法;左线性文法;右线性文法;混合线性文法;L(GL)   中图分类号:TP301.6   1 对于KMP算法的定义和基本思想   KMP算法之所以叫做克努特——莫里斯——普拉特操作,是因为它是由D.E.Knuth与V.R.Pratt和J.H.Morris共同发现的。它的算法原则和重点是依靠已知的模式串W[1,m],去给出next函数的定义,而在这个函数里面又包含W[1,m]自身内部存在的数字信息。   这项算法的整体运用思路是,我们首先假设T[i]=W[j],那么在此前提下,再检查T[i+1]与W[j+1]是不是协调合适,然后可以再假设T[i]大于或者小于W[j],这时要注意两种情况,正文串j=1时就要将W[1,m]向右移动一个单位,再去考察上述两个函数是否匹配,如果1j=m,那么就要将W[1,m]向右移动j-next[j]单位,再进行同样的检查。   2 分析解决办法   2.1 利用GR求右线性文件   首先我们假设W[1,m]a1a2a3…ak-1ak求next[];然后得出GR=(VT,VN,S,Φ);其中VT={ a1,a2,a3,…,ar-1,ar}终结符集;然后我们假设VN={ S,R1,R2,R3,…,Rk-2,Rk-1 }为不是终结符集;令 Ri∈VN,Ri:主串:s⑴…… s(i-j+1)…… s(i-1) s(i) …………;在左面的i个字符与a1a2a3… ak-1ak模式串前i个匹配。   令起始符等于S;然后由Φ产生式集合,得到下式:Ri→bXi+1,j|λ;next[j],当b≠aj(循环计算);S,j=0;j(j初始值i)=终止0,当j=0;Xi+1,j=计算j+1,当b=aj;Rj,j≠0;特别作:Rk→bXi+1,j|λ   2.2 利用GR求左线性文件   首先我们假设W[1,m]akak-1ak-2…a2a1求next[];然后得出GL=(VT,VN,S,Φ);其中:VT={ a1,a2,a3,…,ar-1,ar }终结符集;右侧的i个字符与a1a2a3… ak-1ak;VN={ Lk-1,Lk-2,Lk-3,…,L2,L1,S}非终结符集;其Li∈VN,Li:模式串后i个匹配。   假设始符等于S;然后由Φ产生式集合,得到下面的式子:Li→Xi+1,jb|λ   next[j],当b≠aj(循环计算);S,j=0;   j(j初始值i)= 终止0,当j = 0; Xi+1,j=   计算j+1,当b= aj;Lj,j≠0;   特别作:Lk→Xi+1,jb|λ   2.3 混合线性文法GX生成   首先我们假设W[1,m]a1a2…ax-1ax和akak-1…ax+2ax+1;然后根据已知的混合线性文法GX=(VT,VN,S,Φ);其中:VT={ a1,a2,a3,…,ar-1,ar }终结符集;VN={S,X1,X2,X3,…,Xk-2,Xk-1}非终结符集;令其中的Xi∈VN,   (1)第一种情况就是当x≤i时,左邻的i个字符与a1a2…ax-1ax模式串前个i匹配,在这种情况下就要让GR生成Xi,采用右线性文法GR生成。   (2)第二种情况就是当ix时,右邻近=的i个字符与akak-1…ax+2ax+1模式串W[1,m]的后面有i匹配,在这种情况下就采用GL生成Xi的产生式左线性文法。   (3)特别作:Xk→Xjb|λ且j≤k;   2.4 证明方案的正确性   给定命题S:s={不含有a1a2a3…ak-1ak子系列字符号串|符号集{a1,a2,a3,…,ar-1,ar}}   G:gl=L(GL),gr=L(GR)和gx=L(GX)   ●不妨取gr证明   ●对于s=s1…sisi+1si+2…sn∈s,si∈{a1,a2,a3,…,ar-1,ar}   (1)对k=1时,有R1或X使得:   S→s1R1|bX1,j|λ(b≠s1,≤1,X1,j∈VN);   (2)不妨设k=i且k≠n时,成立,   即:Ri→si+1Ri+1|bi+1Xi+1,j|λ(bi+1≠si+1,≤i+1,使得X

您可能关注的文档

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档