- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]第三章 词法分析1
第三章 词法分析 本章内容 词法分析器:将源程序的字符流翻译成记号流,以及用户接口等任务 构造词法分析器 手工 自动生成 重点 正则表达式 有限状态自动机 自动生成工具:Lex/Flex 词法分析器的主要任务 读入输入字符,产生token序列,交给语法分析使用; 相关辅助任务 过滤注释、空格等; 为了报错,记录每个token在源文件中的位置 3.1.1 词法分析中的问题 Simplicity of design is the most important consideration. Compiler efficiency is improved. Compiler portability is enhanced. 3.1.2 词法记号、模式、词法单元 词法记号(token):源语言文法的终结符,用token name, token value表示。 模式(pattern):源语言中特定记号的构成规则,可以用正则表达式示。 词法单元(词素,lexeme):源程序中和记号的模式相匹配的字符串。 example C statement: printf(“total=%d”, score) id, printf (, literal, “total=%d” ,, id, score ), 记号的例子 记号的例子 下列结构作为token:关键字、操作符、标识符、常量、字符串、标点符号 One token for each keyword. Tokens for the operators One token representing all identifiers. One or more tokens representing constants, such as numbers and literal strings. Tokens for each punctuation symbol 3.1.3 词法记号的属性 用二元组记号,属性值表示;属性一般用符号表的指针来表示 例如,position := initial + rate * 60 ?id,指向符号表中position条目的指针? ?assign _ op, ? ?id,指向符号表中initial条目的指针? ?add_op,+? ?id,指向符号表中rate条目的指针? ?mul_ op, *? ?num,整数值60? 3.1.4 词法错误 词法分析器对源程序采取非常局部的观点 难以发现下面的错误 fi (a == f (x) ) … 在实数是a.b格式下,可以发现下面的错误 123. 紧急方式的错误恢复 错误修补 3.2 词法记号的描述 正则表达式是模式的重要表示方法。 3.2.1 串和语言 字母表:有限符号的集合,例:? = {0,1} 字符串:符号的有穷序列,例:0110, 字符串s的长度:出现在s中符号的个数,记作|s| 空串:长度为0的符号串,用?表示 语言:给定字母表上的任意一个字符串集合 {?,0,00,000,…}, {?}, ? 句子:属于语言的字符串 字符串例子及术语 Suppose: S is the string banana 语言(Language) 语言(Language):某个给定字母表上一个任意可数的字符串集合。 Special Languages: ? and {?} 语言的例子 串的运算 连接 xy s? = ?s = s 乘积(指数) 定义s0为?,si为si-1s(i 0) s1=s, s2=ss, s3=sss,… 3.2.2 语言上的运算 语言的运算 和:L∪M = {s | s ?L 或 s ? M } 连接:LM = {st | s ? L 且 t ? M} 指数:L0 ={? },Li = Li -1L 闭包:L? = L0 ∪ L1 ∪ L2 ∪… 正闭包: L+ = L1 ∪ L2 ∪… 语言运算的例子 L = { A, B, …, Z, a, b, …, z },D = { 0, 1, …, 9 } L ? D is the set of letters and digits; LD is the set of strings consisting of a letter followed by a digit; L4 is the set of all 4-letter strings L* = { All possible strings of L plus ? } L (L ? D )* is the set of all strings of letters and digits beginning with a letter. D+ is th
文档评论(0)