第四章词法分析..ppt

  1. 1、本文档共177页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
由于状态3后面无标号为1的弧,即转移函数f(3,1)没有映射值,因此,将原有状态集合划分成分成三个集合:初态组、非初非终态组、终态组。 即{0},{1,2,3,5}和{4,6,7}。 LEX遇到以下三种情况之一,就会把程序内容照抄过去: (1)介于%{和%}之间的所有内容。 %{ #include stdio.h #include ctype.h %} (2)出现在第二个%%之后的所有内容,即辅助过程部分均被照抄过去。 (3)写在以空格或tab开头的行中的内容。因此,%{和%}以及转换规则必须从第一列写起。 LEX输出文件的生成 例:标识符: digit [0-9] letter [A-Za-z] id ({letter}|[_])({letter}|{digit}|[_])* 带符号整数: integer digit (digit)* sign +| - |ε signinteger sign integer 说明部分可用一个名字代表一个正规式,增加程序的可读性 (2)转换规则:是一串如下形式的LEX语句: R1 {A1} R2 {A2} ∶ ∶ Rm {Am} Ri :正规式 {Ai}:Ai为语句序列,在识别出单词Ri以后,词法分析器所应作的动作。 其基本动作是返回单词的类别编码和单词值。 (3)辅助过程:用户定义的子程序 下面是识别C语言部分单词符号的LEX源程序: /*说明部分*/ digit [0-9]  letter [A-Za-z] id ({letter}|[_])({letter}|{digit}|[_])* %% /*转换规则,每条规则中的动作都用大括号括起来*/ “main”|”int”|”if” {Upper(yytext,yylen); printf(%s,KEY\n,yytext);} {id} {printf(%s,ID\n,yytext);} “+”|”-”|”*” {printf(%s,SYMBOL\n,yytext);} %% /*辅助过程*/ Upper(char *s,int l) { int i; for(i=0;il;i++)    s[i]=outpper(s[i]);    return 1; } void main(void) { yylex( ); } 2.LEX的实现 LEX的功能是根据LEX源程序构造一个词法分析程序,该词法分析器实质上是一个有穷自动机。 LEX生成的词法分析程序有两部分组成: 词法分析程序 由正规式构造DFA 识别单词的控制程序 LEX的处理过程: · 扫描每条转换规则Pi构造一相应的非确定有穷自动机Mi ¨将各条规则的有穷自动机Mi合并成一个新的NFA M 即生成该DFA的状态转换矩阵和识别单词的控制程序 0 P1 ε ε ε M1 P2 M2 P3 M3 ·¨确定化并最小化 ,NFA?DFA 一.读LEX源程序,分别生成NFA,用状态图表示为: 二.合并成一个NFA: 0 3 1 7 4 5 2 6 8 start b b b b a a ε ε ε a 1 2 3 4 5 6 7 8 start start start a a a b b b b 例42 LEX源程序, a { } abb { } a*bb* { } 三.确定化 给出状态转换的矩阵 状态 a b 到达终态所识别的单词 初态 终态 终态 终态 终态 {0,1,3,7} {2,4,7} {8} {7} {5,8}

文档评论(0)

liudao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档