1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
编译第3章

本章将讨论词法分析程序的设计原则,单词的描述技术,识别机制及词法分析程序的自动构造原理。; 1.掌握:正规式,DFA的概念,NFA的概念 2.理解:将 NFA转换为DFA ,正规式、正规文法与有穷自动机间的转换 ;3.1 词法分析程序的设计 3.2 单词的描述工具 3.3 有穷自动机 3.4 正规式与有穷自动机的等价性 3.5 正规文法和有穷自动机的等价性 3.6 词法分析程序的自动构造工具 小结?;3.1.词法分析(lexical analysis) 程序的设计;一.词法与语法分析程序的接口方式;词法分析程序和语法分析程序的关系; 词法分析程序的主要任务: 读源程序,产生单词符号 词法分析程序的其他任务: 滤掉空格,跳过注释、换行符 追踪换行标志,复制出错源程序, 宏展开,…… ;二、词法分析程序的输出;词法分析程序所输出的单词符号常常采用以下二元式表示:(单词种别,单词自身的值)。 单词的种别是语法分析需要的信息,而单词自身的值则是编译其它阶段需要的信息。 对某些单词来说,不仅仅需要它的值,还需要其它一些信息以便编译的进行,那么可以将单词的二元式表示设计成如下形式: (标识符,指向该标识符所在符号表中位置的指针) 单词的种别可以用整数编码表示,假如标识符编码为1,常数为2,保留字为3,运算符为4,界符为5 ;例如:程序段 if i=5 then x∶=y; 在经词法分析器扫描后输出的单词符号和它们的表示如下:  - 保留字if(3,if)  - 标识符i(1,指向i的符号表入口)  - 等号=(4,=)  - 常数5(2,5)  - 保留字then(3,then)  - 标识符x(1,指向x的符号表入口)  - 赋值号∶=(4,∶=)  - 标识符 y(1,指向y的符号表入口)  - 分号;(5,;)   ; 三、词法分析工作从语法分析工作独立出来的原因: 简化设计 改进编译效率 增加编译系统的可移植性 ;3.2 单词的描述工具;1.正规文法;2.正规式(regular expression); 定义(正规式和它所表示的正规集): 设字母表为?,辅助字母表?`={?,?,?,?,?,?,?}。 ?和?都是?上的正规式,它们所表示的正规集分别为{?}和? ; 2 任何a? ?,a是?上的一个正规式,它所表示的正规集为{a};; 3 假定e1和e2都是?上的正规式,它们所 表示的正规集分别为L(e1)和L(e2), 那么,(e1), e1? e2, e1?e2, e1?也都是正规式,它们所表示的正规集分别为L(e1), L(e1)?L(e2), L(e1)L(e2)和(L(e1))?。 4 仅由有限次使用上述三步骤而定义的表达式才是?上的正规式,仅由这些正规式所表示的集合才是?上的正规集;正规式中的符号说明;例子; ; ;例3.2 ?={d,?,e,+,-},则?上的正规式 :d?(?dd ?? ? )(e(+?- ??)dd? ??) 其中d为0~9的数字。 ; 若两个正规式e1和e2所表示的正规集相同,则说e1和e2等价,写作e1=e2。 例如: e1= (a?b), e2 = b?a 又如: e1= b(ab)? , e2 =(ba)?b 再如: e1= (a?b)? , e2 =(a??b?)?;设r,s,t为正规式,正规式服从的代数规律有: 1 r?s=s?r “或”服从交换律 2 r?(s?t)=(r?s)?t “或”的可结合律 3 (rs)t=r(st) “连接”的可结合律 ;4 r(s?t)=rs?rt (s?t)r=sr?tr 分配律 5 ?r=r, r?=r ?是“连接”的恒等元素 6 r?r=r r?=??r?rr?… “或”的抽取律 ;正规文法和正规式;例如:将R=a(a|d) *转换成正规文法;2、正规文法转换成正规式;例如:文法G[S]为:S-aA, S-a, A- aA, A-dA, A-a, A-d;3.3 有穷自动机 有穷自动机(也称有限自动机)作为一种识别装置,它能准确地识别正规集,即识别正规文法所定义的语言和正规式所表示的集合,引入有穷自动机这个理论,正是为词法分析程序的自动构造寻找特殊的方法和工具。 ;有穷自动机分为两类:确定的有穷自动机(Deterministic Finite Automata)和不确定的有穷自动机(Nondeterministic Finite Automata) 。 ;关于有穷自动机我们将讨论如下题目;3.3.1确定的有穷自动机DFA;3.f是转换函数,是在K×Σ→K上的映射,即,如 f(ki,a)=

文档评论(0)

ahuihuang1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档