编译原理课件.pptxVIP

编译原理课件.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共236页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1第2章 词法分析二工大 温敬和2008年1月25日 22.1 词法分析器的设计考虑及手工构造2.1.1 单词类型及二元式编码2.1.2 源程序的输入及预处理2.1.3 基本字的识别和超前搜索2.1.4 遍2.1.5 状态转换图和词法分析器的手工构造 2.2 正规式、自动机及词法分析器的自动生成2.2.1 基本概念 2.2.2 正规式与正规集2.2.3 确定有限自动机(DFA)2.2.4 非确定有限自动机(NFA)2.2.5 正规式与确定有限自动机的等价性 2.3 词法分析器的自动生成 32.1 词法分析器的设计考虑及 手工构造词法分析任务: 从文件读入源程序,去除源程序中与编译无关的编辑字符、注释等,由字符拼接单词。每当识别出一个单词,就用单词的内部码(单词二元式)替换。执行词法分析任务的程序称为词法分析器。 42.1.1 单词类型及二元式编码㈠单词类型 任何程序设计语言的单词都可将其分为5种类型,它们是:基本字 real、integer、……标识符 通常为以字母开始的数字字母串(简单变量、标号、……)常数 整常数(123)、实常数(123.456)、……运算符 +、*、/、……界符 ; 、(、)、……㈡单词的性质基本字、运算符和界符对于某一程序设计语言来说是确定的,而源程序中的标识符和常数的个数是不确定的,随源程序而异。有些单词由单个字符构成,而有些单词由多个字符构成。 5㈢单词二元式编码 经词法分析后,单词用二元式 (code,val) 表示。code表示单词的种别,用整数码表示。单词种别表示单词的语法特性,在语法分析时使用。val表示单词的值,在本书中用字符串表示。单词值表示了单词的语义特性,在语义分析时使用。㈣编码原则通常将标识符归为一种,常数按类型分种,基本字、运算符及界符采用一符一种。如果一个种别仅包含一个单词,那么单词种别就可代表该单词,无需给出单词值。为了输入和处理的方便,无意义的单词值用字符串NUL表示。若一个种别含有多个单词,除给出种别外,还需给出它的值。 6㈤实例 设有某一程序设计语言,其部分单词二元式编码如下所示:单词 单词种别单词值 integer aNULrealcNULbegin{NULend}NUL标识符 i字符串形式符号名 无符号整常数 x字符串形式数字 无符号实常数 y字符串形式数字 ==NUL**NUL++NUL((NUL))NUL,,NUL;;NUL 计算园柱体表面积的源程序(输入输出略)如下所示:Begin/*S=2*3.14* R* R +2*3.14* R*H */ Real r,h,s; s=2*3.14*r*(r+h)End 根据单词二元式编码,上述程序的单词二元式序列应为: ({,NUL) ………… 72.1.2 源程序的输入及预处理 ㈠源程序的输入 分段读入处理(早期)全部读入后处理 源程序以文件形式存于外存,首先要将其读入内存才可进行词法分析。早期计算机内存较小,只能在内存设置长度有限的缓冲区,分段读入源程序进行处理。在编制程序时,必须考虑由于源程序分段读入所产生的问题。例如,由多个字符构成的单词有可能被缓冲区边界所打断(留作习题)。目前计算机所使用的的内存已超过若干年前硬盘容量,计算机内存足以容纳源程序的全部,故源程序可一次全部读入内存进行处理。 8 设源程序如下所示,其中\为续行符。Begin/*S=2*3.14*R*R+2*3.14*R*H*/\n\tReal r,h,s;\n\ts=2*3.\\n14*r*(r+h)\nEnd\n\0......\0源程序读入后,输入缓冲区的内容如下所示: 9㈡预处理 词法分析器通常由二个部分构成: 预处理程序 扫描器(单词识别程序)①分成二部分的理由目前使用的程序设计语言大都采用自由格式书写,允许在单词之间存在多余的空格、换行和制表符(TAB)。源程序通常带有注释,注释不是程序的必要组成部分。有些语言还提供续行功能(例C语言中的续行符\),当一个单词过长(例字符串常数),可分多行列出。对于Fortran和Cobol之类语言,源程序还受到书写格式的限制。 词法分析器可在输入缓冲区上直接识别单词,但从程序设计的角度来看,若把源程序预处理一下,则单词识别就比较容易。 10②预处理主要工作删除注释删除续行符,以及后续换行符(0AH)。换行符、TAB和空格具有界符作用,预处理时通常予以保留。在后面的分析中可以看到,它们的存在反而给后续的单词识别带来方便。为了简化判断,可在预处理时,将换行符和TAB统一替换为空格。大多数语言(除C语言)不区分大小写,可在预处理时,将大写字母变换成小写字母,或相反,以方便后续处理。对于受书写格式限制的语

文档评论(0)

子不语 + 关注
官方认证
服务提供商

平安喜乐网络服务,专业制作各类课件,总结,范文等文档,在能力范围内尽量做到有求必应,感谢

认证主体菏泽喜乐网络科技有限公司
IP属地山东
统一社会信用代码/组织机构代码
91371726MA7HJ4DL48

1亿VIP精品文档

相关文档