- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 实验目的; 完整地指出TINYC的词法结构,也就是:定义记号和它们的特性 实验内容;TINYC的记号分为3个典型类型:保留字、特殊符号和“其他”记号。保留字一共有8个,它们的含义类似。特殊符号有10种:分别是4种基本的整数运算符号、2种比较符号,以及括号、分号和赋值符号。除了赋值符号是两个字符的长度之外,其余均为一个字符。表1 TINYC语言的记号保留字特殊符号其他if+数(1个或更多的数字)then-else*end/repeat=until标识符(1个或更多的字母)read(write);:=其他记号就是数了,它们是一个或多个数字以及标识符的序列,而标识符又是(为了简便)一个或多个字母的序列。除了记号之外,TINYC还要遵循以下的词法惯例:注释应放在花括号{...}中,且不可嵌套;代码应是自由格式;空白格由空格、制表位和新行组成;最长子串原则后须接识别记号。在为该语言设计扫描程序时,可以从正则表达式开始并根据前一节中的算法来开发NFA和DFA。实际上,前面已经给出了数、标识符和注释的正则表达式。其他记号的正则表达式都是固定串,因而均不重要。由于扫描程序的DFA记号十分简单,所以无需按照这个例程就可直接开发这个DFA了。我们按一下步骤进行。首先要注意到除了赋值符号之外,其他所有的特殊符号都只有一个字符,这些符号的DFA如下:在该图中,不同的接受状态是由扫描程序返回的记号区分开来。如果在这个将要返回的记号(代码中的一个变量)中使用其他指示器,则所有接受状态都可集中为一个状态,称之为DONE。若将这个二状态的DFA与接受数和标识符的DFA合并在一起,就可得到下面的DFA: 请注意,利用方括号指出了不可被消耗的先行字符。 现在需要在这个DFA中添加注释、空白格和赋值。一个简单的从初始状态到其本身的循环要消耗空白格。注释要求一个额外的状态,它由花括号左边达到并在花括号右边返回到它。赋值也需要中间状态,它由分号上的初始状态达到。如果后面紧跟有一个等号,那么就会生成一个赋值记号。反之就不消耗下一个字符,且生成一个错误记号。实际上,未列在特殊符号中的所有单个字符既不是空白格或注释,也不是数字或字母,它们应被作为错误而接受,我们将它们与单个字符符号混合在一起。如下图是为扫描程序给出的最后一个DFA。在上面的讨论或上图中的DFA都未包括保留字。这是因为根据DFA的观点,而认为保留字与标识符相同,以后再在接受后的保留字表格中寻找标识符是最简单的。当然,最长子串原则保证了扫描程序唯一需要改变的动作是被返回的记号。因为,仅在识别了标识符之后才考虑保留字。现在再来讨论实现这个DFA的代码,它已被放在了scan.h文件和scan.c文件之中。其中最主要的过程是getToken,它消耗输入字符并根据上图中的DFA返回下一个被识别的记号。这个实现利用了双重嵌套情况分析,以及一个有关状态的大型情况列表,在大列表中的是基于当前输入字符的单独列表。记号本身被定义成globals.h中的枚举类型,它包括在表1中列出的所有记号以及内务记号ENDFILE(当达到文件的末尾时)和ERROR(当遇到错误字符时)。扫描程序的状态也被定义为一个枚举类型,但它是位于扫描程序之中。扫描程序还需总地计算出每个记号的特性,并有时会采取其他动作(例如将标识符插入到符号表中)。在TINYC扫描程序中,所要计算的唯一特性是词法或是被识别的记号的串值,它位于变量tokenString之中。这个变量同getToken一并是提供给编译器其他部分的唯一的两个服务,它们的定义已被收集在头文件scan.h。声明了tokenString的长度固定为41,因此那个标识符也就不能超过40个字符(加上结尾的空字符)。后面还会提到这个限制。扫描程序使用了3个全程变量:文件变量source和listing,在globals.h中声明且在main.c中被分配和初始化的整型变量lineno。由getToken过程完成的额外的簿记如下所述:表reservedWords和过程reservedLookup完成位于由getToken的主要循环识别的标识符之后的保留字的查找,currentToken的值也随之改变。标志变量save被用作指示是否将一个字符增加到tokenString之上;由于需要包括空白格、注释和非消耗的先行,所以这些都是必要的。到扫描程序的字符输入由getNextChar函数提供,该函数将一个256-字符缓冲区内部的lineBuf中的字符取到扫描程序中。如果已经耗尽了这个缓冲区,且假设每一次都获取了一个新的源代码行(以及增加的lineno),那么getNextChar就利用标准的C过程fgets从source文件更新改缓冲区。虽然这个假设允许了更简单的代码,但却不能正确地处理行的字数超
您可能关注的文档
- 浙江省名校新高考研究联盟2018届第一次联考数学试题和答案.doc
- 浙江省宁波市江东区2014-2015年七年级上学期期末考试科学试卷.doc
- 浙江省杭州市萧山区靖江初级中学2016届九年级2月期初质量检测科学考试试题.doc
- 浙江省绍兴市2017年中考英语考试试题.doc
- 浙江省台州市2017年中考数学考试试题.docx
- 浙江省嵊州市2016届高三上学期期末教学质量检测数学文试题_包含答案.docx
- 浙江省温州市2016-2017年高一生物下学期期中试题.doc
- 浙江省小学语文课堂教学评比活动材料教案设计_反思_体会.doc
- 浙江省信息技术学考VB模块基础检测(附参考 答案).docx
- 浙江省中小学心理辅导室建设标准与运行规范.doc
文档评论(0)