第四章词法分析..ppt

下载文档 降价啦

39
0
约 177页
2016-12-19 发布于重庆
举报
版权申诉
保障服务

第四章词法分析..ppt

1、本文档共177页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

由于状态3后面无标号为1的弧，即转移函数f(3,1)没有映射值，因此，将原有状态集合划分成分成三个集合：初态组、非初非终态组、终态组。即{0},{1,2,3,5}和{4,6,7}。 LEX遇到以下三种情况之一，就会把程序内容照抄过去：（1）介于%{和%}之间的所有内容。 %{ #include stdio.h #include ctype.h %} （2）出现在第二个%%之后的所有内容，即辅助过程部分均被照抄过去。（3）写在以空格或tab开头的行中的内容。因此，%{和%}以及转换规则必须从第一列写起。 LEX输出文件的生成例：标识符： digit [0-9] letter [A-Za-z] id ({letter}|[_])({letter}|{digit}|[_])* 带符号整数： integer digit (digit)* sign +| - |ε signinteger sign integer 说明部分可用一个名字代表一个正规式，增加程序的可读性（2）转换规则：是一串如下形式的LEX语句： R1 {A1} R2 {A2} ∶ ∶ Rm {Am} Ri ：正规式 {Ai}：Ai为语句序列，在识别出单词Ri以后，词法分析器所应作的动作。其基本动作是返回单词的类别编码和单词值。（3）辅助过程:用户定义的子程序下面是识别C语言部分单词符号的LEX源程序： /*说明部分*/ digit [0-9] 　letter [A-Za-z] id ({letter}|[_])({letter}|{digit}|[_])* %% /*转换规则，每条规则中的动作都用大括号括起来*/ “main”|”int”|”if” {Upper(yytext,yylen); printf(%s,KEY\n,yytext);} {id} {printf(%s,ID\n,yytext);} “+”|”-”|”*” {printf(%s,SYMBOL\n,yytext);} %% /*辅助过程*/ Upper(char *s,int l) { int i; for(i=0;il;i++) 　　　s[i]=outpper(s[i]); 　　 return 1; } void main(void) { yylex( ); } 2.LEX的实现 LEX的功能是根据LEX源程序构造一个词法分析程序，该词法分析器实质上是一个有穷自动机。 LEX生成的词法分析程序有两部分组成: 词法分析程序由正规式构造DFA 识别单词的控制程序 LEX的处理过程： · 扫描每条转换规则Pi构造一相应的非确定有穷自动机Mi ¨将各条规则的有穷自动机Mi合并成一个新的NFA M 即生成该DFA的状态转换矩阵和识别单词的控制程序 0 P1 ε ε ε M1 P2 M2 P3 M3 ·¨确定化并最小化，NFA?DFA 一.读LEX源程序，分别生成NFA，用状态图表示为：二.合并成一个NFA： 0 3 1 7 4 5 2 6 8 start b b b b a a ε ε ε a 1 2 3 4 5 6 7 8 start start start a a a b b b b 例42 LEX源程序， a { } abb { } a*bb* { } 三.确定化给出状态转换的矩阵状态 a b 到达终态所识别的单词初态终态终态终态终态 {0,1,3,7} {2,4,7} {8} {7} {5,8}