词法分析程序的设计.pptVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.5 词法分析程序的设计 确定词法分析器的接口 确定单词分类和Token结构 特殊问题的处理 用状态转换图构造词法分析程序 回顾: 词法分析的主要任务是:从左到右逐个字符地扫描源程序,产生一个个单词(Token),同时检查源程序中的词法错误。执行词法分析的程序称为词法分析程序或扫描程序(Scanner)。 单词是语言中具有独立意义的最小单位,包括保留字、标识符、运算符、标点符号和常量等。 1. 确定词法分析器的接口 确定词法分析器是作为语法分析的一个子程序还是作为独立一遍 词法分析作为独立一遍 将字符流的源程序变成单词序列,输出到一个中间文件上,做为语法分析的输入。 词法分析作为语法分析的子程序 每当语法分析程序需要一个单词时,则调用该子程序,从源程序中分析和返回一个单词 2. 确定单词分类和Token结构 设计词法分析器的首要任务是,对于源语言的单词进行仔细的分析,并列出所有可能的不同单词,然后再确定单词的内部表示 程序设计语言中的大部分单词,一般可分为以下几类: 1.基本字(关键字):如 begin,end,if 等 2.标识符:用来表示常量、变量、过程等名字 3.常数:各种类型的常数,如 15,3.14,TRUE 4.运算符:如 +,—,*,/ 5.界符:如逗号,分号,括号等 单词的机内表示 二元式(单词种别,单词自身的值) 种别是语法分析需要的信息 自身值是编译其他阶段需要的信息 种别编码(常用整数编码) 方法一:按单词的5大种类每种一个码,例如标识符为l,常数为2,基本字为3,运算符为4,界符为5。 方法二:每个基本字一个编码;所有标识符为一个编码;常数按类型分类,每类一个编码;每个运算符一个编码;每个界符一个编码。 单词自身值 对常数,基本字,运算符,界符就是他们本身的值 对标识符,将标识符的名字登记在符号表中,“自身值”是指向该标识符所在符号表中位置的指针. 例如 源程序if i=5 then x:=y; 种别编码:标识符为l,常数为2,基本字为3,运算符为4,界符为5 词法分析后输出的单词序列是: (3,‘if’) (1,指向i的符号表入口) (4,‘=’) (2,‘5’) (3,‘then’) (1,指向x的符号表入口) (4,‘:=’) (1,指向y的符号表入口) (5,‘;’) 3. 特殊问题的处理 标识符和保留字的区分 事先构造保留字表,拼出的标识符单词先查保留字表,若有,则把它做为保留字处理 空格符和制表符(Tab)以及换行符的处理 无用的空格符和制表符要删掉; 字符串内的空格不能删; 换行符不能删,对于错误处理起作用。 复合型特殊符,如“:=”的处理 读到“:”时不能判断是否为冒号,必须读下一字符。 括号类配对: “‘”和“’”、左注释符和右注释符的配对。也可以把begin …end ,if …then,[ ],{ },( )等语法配对在词法分析中进行处理 处理方法: 对每类括号设置一个计数器(初值=0) 每当遇到左括号,则计数器加1 每当遇到右括号时,计数器减1 词法分析结束时,如果计数器?0,则表明括号不匹配。 4. 用状态转换图构造词法分析程序 可通过状态转换图来实现词法分析程序的构造,步骤: 画状态转换图。 由正规文法构造状态转换图 由正规表达式构造状态转换图 将正规文法或正规表达式转换成DFA(经历NFA的构造,将NFA确定化,DFA最小化的过程),将DAF以状态转换图的形式表现出来。 按状态转换图写出词法分析程序 对于状态图中的每一状态构造一段代码具体构造程序时: 开始结点 开始结点是一个单词识别的开始,单词开始符是非空白字符,首先把非空白字符读入ch,再按该字符的特征进入不同种类单词的识别 GetChar();/*从输入串读一个字符,放入 ch中*/ GetBC();/*检查ch中字符是否空白,若是则调用GetChar,直至ch中为非空白字符*/ If (ch=…) begin …end else if (ch=…) begin …end … else 错误处理; 不含回路的分叉结点,对应switch语句或一组if…then…else语句 终态结点,一般对应一个 return(code,value)语句,code是单词种别码,value是单词自身值,意为返回调用者: 当词法分析作为语法分析的子程序,返回到语法分析 当词法分析作为独立一遍,返回进行新的单词识别 * * 独立词法分析器 语法分析 Token序列 源程序 附属词法分析器 语法分析 调用 Token 源程序 i j k 数字 字母 / l 例:状态结点 i 对应的

文档评论(0)

精华文档888 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档