利用有限自动机分析正则表达式.docVIP

下载本文档

4
0
约2.63千字
约 4页
2018-12-19 发布于贵州
举报
版权申诉

利用有限自动机分析正则表达式.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

利用有限自动机分析正则表达式

利用有限自动机分析正则表达式版权声明：可以任意转载，但转载时必须标明原作者charlee、原始链接以及本声明。程序编译的第一个阶段是词法分析，即把字节流识别为记号(token)流，提供给下一步的语法分析过程。而识别记号的方法就是正则表达式的分析。本文介绍利用有限自动机分析表达式的方法。概念将正则表达式转换为NFA(Thompson构造法) 算法性质示例将NFA转化为DFA 算法示例NFA和DFA的效率概念记号有字母表中的符号组成的有限长度的序列。记号s的长度记为|s|。长度为0的记号称为空记号，记为ε。有限自动机(Finite State Automaton) 为研究某种计算过程而抽象出的计算模型。拥有有限个状态，根据不同的输入每个状态可以迁移到其他的状态。非确定有限自动机(Nondeterministic Finite Automaton) 简称NFA，由以下元素组成：1.有限状态集合S；2.有限输入符号的字母表Σ；3.状态转移函数move；4.开始状态sSUB{0}；5.结束状态集合F，F∈S。自动机初始状态为sSUB{0}，逐一读入输入字符串中的每一个字母，根据当前状态、读入的字母，由状态转移函数move控制进入下一个状态。如果输入字符串读入结束时自动机的状态属于结束状态集合F，则说明该自动机接受该字符串，否则为不接受。确定有限自动机(Deterministic Finite Automaton) 简称DFA，是NFA的一种特例，有以下两条限制：1.对于空输入ε，状态不发生迁移；2.某个状态对于每一种输入最多只有一种状态转移。将正则表达式转换为NFA(Thompson构造法) 算法算法1将正则表达式转换为NFA(Thompson构造法) 输入字母表Σ上的正则表达式r 输出能够接受L(r)的NFA N 方法首先将构成r的各个元素分解，对于每一个元素，按照下述规则1和规则2生成NFA。注意：如果r中记号a出现了多次，那么对于a的每次出现都需要生成一个单独的NFA。之后依照正则表达式r的文法规则，将生成的NFA按照下述规则3组合在一起。规则1对于空记号ε，生成下面的NFA。规则2对于Σ的字母表中的元素a，生成下面的NFA。规则3令正则表达式s和t的NFA分别为N(s)和N(t)。 a)对于s|t，按照以下的方式生成NFA N(s|t)。 b)对于st，按照以下的方式生成NFA N(st)。 c)对于s*，按照以下的方式生成NFA N(s*)。 d)对于(s)，使用s本身的NFA N(s)。性质算法1生成的NFA能够正确地识别正则表达式，并且具有如下的性质： N(r)的状态数最多为r中出现的记号和运算符的个数的2倍。N(r)的开始状态和结束状态有且只有一个。N(r)的各个状态对于Σ中的一个符号，或者拥有一个状态迁移，或者拥有最多两个ε迁移。示例利用算法1，根据正则表达式r=(a|b)*abb可以生成以下的NFA。将NFA转化为DFA 算法使用以下的算法可以将NFA转换成等价的DFA。算法2将NFA转化为DFA 输入NFA N 输出能够接受与N相同语言的DFA D 方法本算法生成D对应的状态迁移表Dtran。DFA的各个状态为NFA的状态集合，对于每一个输入符号，D模拟N中可能的状态迁移。定义以下的操作。操作说明 ε-closure(s)从NFA的状态s出发，仅通过ε迁移能够到达的NFA的状态集合 ε-closure(T)从T中包含的某个NFA的状态s出发，仅通过ε迁移能够到达的NFA的状态集合 move(T,a)从T中包含的某个NFA的状态s出发，通过输入符号a迁移能够到达的NFA的状态集合令Dstates中仅包含ε-closure(s),并设置状态为未标记； while Dstates中包含未标记的状态T do begin 标记T； for各输入记号a do begin U：=ε-closure(move(T,a))； if U不在Dstates中then 将U追加到Dstates中，设置状态为未标记； Dtrans[T,a]：=U； end endε-closure(T)的计算方法如下：将T中的所有状态入栈；设置ε-closure(T)的初始值为T； while栈非空do begin 从栈顶取出元素t； for从t出发以ε为边能够到达的各个状态u do if u不在ε-closure(T)中then begin 将u追加到ε-closure(T)中；将u入栈； end end示例将上面生成的NFA转化为DFA。最初，Dstates内仅有ε-closure(0)=A={0,1,2,4,7}。然后对于状态A，对于输入记号a，计算ε-closure(move(A,a))=ε-clo