北京外国语大学《编译原理》课件-第1章 引言.pptVIP

  • 1
  • 0
  • 约1.32万字
  • 约 65页
  • 2023-04-26 发布于河北
  • 举报

北京外国语大学《编译原理》课件-第1章 引言.ppt

大学,本科,专科,硕士,笔记,课件,期中试卷答案,期末试卷答案,教材答案,知识点,经济法,材料科学基础,材料力学,电路,电子技术基础,高频电子线路,宏观经济学,模拟电路基础,模拟电子技术,数字电路,数字电子技术,数字信号处理,通信原理,信号与系统,化工原理,机械设计基础,机械原理,机械制图,微机原理与接口技术,C++程序设计,JAVA技术与应用,MATLAB基础与应用,计算机网络,计算机组成原理,软件工程数据结构,工程力学,工程热力学,结构力学,力学,流体力学,水力学,工程测量,工程经济学,工程

(2) 编译器的基本组成:以阶段划分编译器,阶段包括词法分析、语法分析、语义分析、中间代码生成、中间代码优化、目标代码生成、符号表管理以及出错处理。 (3) 编译器的分析-综合模式:把编译器分为前端和后端。前端称为分析,它的输出与机器无关;后端称为综合,以前端的输出为输入,其输出与具体机器指令密切相关。编译器的这种划分方式,有利于编译器的开发、维护与移植。 (4) 编译器的扫描遍数:对程序(源程序、中间表示等)的一次完整的扫描称为一遍。影响扫描遍数的因素是多样的,减少扫描遍数的思路也是多样的。 (5) 编译器的编写工具:特别需要了解的是词法分析器和语法分析器的编写工具。 语义分析器根据语法分析器构造的语法树,进行适当的语义处理。对于声明语句,进行符号表的查填。下述符号表部分的内容中,每一行存放一个符号的信息,第一行存放标识符x的信息,它的类型是real,为它分配的地址是0。第二行存放y的信息,它的类型是real,为它分配的地址是4。由此可知,我们为每个实型数分配一个大小为四个单位的存储空间。对于可执行语句,检查结构合理的表达式运算是否有意义。由于变量x,y,z均是real,而60被认为是integer,因此,语义检查时需要进行把60转换为60.0的处理。反映在语法树上,就是增加了一个新节点itr?(将整型数转换为实型数)。 语义分析 由于声明语句并不生成可执行的代码,所以到此为止,对声明语句的处理已经完成。下边开始的中间代码生成,仅涉及源程序中的赋值句。中间代码生成器对语法树进行遍历,并生成可以顺序执行的中间代码序列。最常用的中间代码形式是四元式,它的基本形式为: (序号) (op, arg1, arg2, result) 操作符 左操作数 右操作数 结果 操作符也被称为算符,操作数也被称为算子。上式表示第(序号)个四元式,arg1和arg2进行op运算,结果存进result。如四元式 (+,x,y,T)表示的运算为T := x + y,而四元式 (:= ,x, ,T)表示的运算为T := x。为了表示上的直观,有时也把四元式直接表示为T := x + y和T := x的形式。这似乎与程序设计语言中的表达式在表示上没有什么区别,因此有时需要根据上下文来确定是算术表达式还是四元式。另外,四元式的一个特征是赋值号右边最多只有一个操作符和两个操作数。 ? 中间代码生成 ?(1) ?(itr, 60, , T1) (2) ?(*, id3, T1, T2) (3) ?(+, id2, T2, T3) (4) ?(:=, T3, , id1) 下一步工作就可以对中间代码进行优化了。分析上边的4个四元式可以看出,60是编译时已经知道的常数,所以把它转换成60.0的工作可以在编译时完成,没有必要生成(1)号四元式。再看(4)号四元式,它的作用仅是把T3的值传给id1(这样的运算被称为复写传播),不难看出,这条四元式也是多余的。经过优化后,4个四元式减少为两个。 (1) ?(*, id3, 60.0, T1) (2) ?(+, id2, T1, id1) 中间代码优化 最后从优化后的中间代码生成目标代码。这里的目标代码是汇编指令,其中MOVF、MULF和ADDF分别表示浮点数的传送、乘和加操作。对于二元运算MULF和ADDF,操作形式为OP source,target,它表示target := source OP target,即sorce与target进行OP运算,结果存进target。对于一元运算MOVF,操作形式为MOVF source,target,它表示target := source,即将source中的内容移进target中。 MOVF id3, R2 MULF #60.0, R2 MOVF id2, R1 ADDF R2, R1 MOVF R1, id1 目标代码生成 1.词法分析 词法分析器根据词法规则识别出源程序中的各个记号(token),每个记号代表一类单词(lexeme)。源程序中常见的记号可以归为以下几大类,其中每一类均可再细分。 (1) 关键字: 如var、begin、end ...,它们在源程序中均有特定含义,一般不作它用,在这种情况下也被称为保留字。 (2

文档评论(0)

1亿VIP精品文档

相关文档