- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[申优论文北航本科编译原理大作业
How to Design a C++ Object-oriented Compiler
罗杨Abstract
This system is a C++ object-oriented compiler using a extended C0 grammar as the input language. It can generate the assembly code according to the Intel 386 instructions set. You can use the Masm32v10 software to assemble and link the source code to get your 32-bit applications.
摘要
本系统实现了一个以扩充C0文法为输入语言的采用C++及面向对象思想设计的编译器,可以生成符合386指令集规范的汇编代码,用Masm32v10汇编可生成32位应用程序。
本系统考虑到不同版本的Masm的功能和使用方法的差异,以及用户手工键入汇编,连接命令多有不便,本系统自带了汇编器Ml.exe和连接器link.exe。
正文
由于是目标是Windows平台下32位应用程序,有些文法中的功能如输入和输出无法再像16位汇编时调用DOS中断解决,因此对于这些问题我使用Microsoft提供的类似高级语言的设计方法——调用DLL函数来解决。其实32位汇编语言在函数调用方面已与高级语言相差无异,可以调用系统API,C RunTime甚至是用户DLL中的函数。
本系统是一遍扫描编译程序,采用面向对象的方法进行构建,各个主要部分均抽象成类。主要的类有:分析器类Parser,符号表管理器类SymbolTableMgr,四元式管理器类QuadrupleMgr,代码生成器类CodeGenerator,错误处理器类ErrorHandler,全局数据流分析器类GDAOptimizer, 全局寄存器分配器类GRDOptimizer,局部公共子表达式删除器类CSDOptimizer,以上属于具有明显功能划分和界限区别的“高级类”,他们的对象在全局main函数中分别构造和删除;系统中还有其它一些既具有数据结构意义又具有功能操作的“中级类”,它们一般是“高级类”或“中级类”的成员,如基本块集合管理器BBSetMgr,由全局数据流分析器类GDAOptimizer构建,并为其它多个优化器类共享;还有一些相对意义上的“低级类”,它们具有复杂的数据结构,却几乎没有功能操作,通常由“中级类”或“高级类”得数组成员进行管理,如项类Item,四元式类Quadruple,其中项类Item代表符号表中的每一项,四元式类Quadruple顾名思义代表一个四元式,并且四元式的三个操作数是指向项Item的指针。由于这些“低级类”对象通常代表基本数据,数量众多而又经常在各个高级对象之间传递,为了减少时间空间的开销,本系统对所有的类均采用指针构造,这样需要传递的就不是对象而只是一个指针了,有效地提高了程序的运行效率。
本系统的一个特点是词法分析和语法分析结合,其功能集成在词法与语法分析类Parser里,虽然本系统整体式面向对象的,但由于词法分析和语法分析本身的特性,Parser类却具有明显的面向过程的特征:各个代表文法子程序的层次关系,中间不断嵌入的词法程序和语义程序(动作符号子程序),这样的体系几乎体现不出面向对象抽象封装的优势,因此我在这部分虽然代码写的很快,调试却花了比写还要长的时间,这的确说明了我前期的程序框架没有设计好,没有一个好的结构的程序,代码量不大时并不会体现出它的缺陷,但是随着规模的扩大,功能的复杂化,程序最后会达到难以维护的程度。因此我觉得在词法与语法分析方面能构造出一个简便适用的面向对象的模型非常必要。
另外在语法分析方面,考虑到题目中的C0文法并无左递归问题,只有回溯问题。根据课本,为了消除回溯可以用改写文法或是预读字符的方法。当时课堂上老师着重讲了改写文法的方法,预读字符的方法只是介绍了一下。但是我考虑到若改写成等价文法,使规则右部多个候选式首符号集不相交的话,虽然语法分析变得简单了,但改写后的规则中的符号含义变得不明确,本来是语义连贯的动作符号语义子程序,可能因为文法的改写被分到不同的语法递归子程序中,参数传递复杂而繁琐,而且模糊了语义编写时容易出错。反而给语义分析带来更大的麻烦。因此我采用预读字符的方法处理回溯问题,由于在预读字符时只是进行语法分析,并没有语义处理,因此不会出现课本上所说的“相关的语义分析工作在回溯时也要推倒重来”的情况,不难验证,这两种方法在运行速度上并无本质差别。
我认为本系统一个比较突出的亮点是中间代码——四元式的操作数均为指向符号表某一项的
文档评论(0)