- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
v1.0可编写可改正
实验一词法剖析程序实现
一、实验目的与要求
经过编写和调试一个词法剖析程序,掌握在对程序设计语言的源程序进行扫描的过程中,将
字符流形式的源程序转变为一个由各种单词符号构成的流的词法剖析方法
二、实验内容
基本实验题目:若某一程序设计语言中的单词包含五个重点字begin、end、if、then、
else;表记符;无符号常数;六种关系运算符;一个赋值符和四个算术运算符,试结构能识
别这些单词的词法剖析程序(各种单词的分类码拜见表I)。
表I语言中的各种单词符号及其分类码表
单词符号
类型编码
类型码的助记符
单词值
begin
1
BEGIN
end
2
END
if
3
IF
then
4
THEN
else
5
ELSE
表记符
6
ID
字母打头的字母数字串
无符号常数
7
UCON
机内二进制表示
8
LT
=
9
LE
=
10
EQ
11
NE
12
GT
=
13
GE
:=
14
IS
+
15
PL
-
16
MI
*
17
MU
/
18
DI
1
v1.0可编写可改正
输入:由切合和不切合所规定的单词类型结构的各种单词构成的源程序言件。
输出:把所辨别出的每一单词均按形如(CLASS,VALUE)的二元式形式输出,并将结果
放到某个文件中。关于表记符和无符号常数,CLASS字段为相应的类型码的助记符;VALUE
字段则是该表记符、常数的详细值;关于重点字和运算符,采纳一词一类的编码形式,仅需
在二元式的CLASS字段上搁置相应单词的类型码的助记符,VALUE字段则为“空”。
三、实现方法与环境
词法剖析是编译程序的第一个办理阶段,
能够经过两种门路来结构词法剖析程序。
其一
是依据对语言中各种单词的某种描绘或定义(如
BNF),用手工的方式(比如可用
C语言)
结构词法剖析程序。一般地,能够依据文法或状态变换图结构相应的状态矩阵,
该状态矩阵
连同控制程序一同便构成了编译器的词法剖析程序;
也能够依据文法或状态变换图直接编写
词法剖析程序。结构词法剖析程序的此外一种门路是所谓的词法剖析程序的自动生成,
即首
先用正规式对语言中的各种单词符号进行词型描绘,
并分别指出在辨别单词时,
词法剖析程
序所应进行的语义办理工作,而后由一个所谓词法剖析程序的结构程序对上述信息进行加
工。如美国BELL实验室研制的LEX就是一个被宽泛使用的词法剖析程序的自动生成工具。
办理过程简述:在一个程序设计语言中,
一般都含有若干类单词符号,
为此可第一为每
类单词成立一张状态变换图,
而后将这些状态变换图归并成一张一致的状态图,
即获取了一
个有限自动机,再进行必需确实定化和状态数最小化办理,
最后增添当进行状态转移时所需
履行的语义动作,就能够据此结构词法剖析程序了。
为了使词法剖析程序结构比较清楚,
且尽量防止某些枝节问题的纠葛,
我们假设要编译
的语言中,所有重点字都是保存字,
程序员不得将它们作为源程序中的表记符;
在源程序的
输入文本中,重点字、表记符、无符号常数之间,若未出现关系和算术运算符以及赋值符,
则起码须用一个空白字符加以分开。
作了这些限制此后,就能够把重点字和表记符的辨别统
一进行办理。即每当开始辨别一个单词时,
若审视到的第一个字符为字母,
则把后续输入的
字母或数字字符挨次进行拼接,
直至审视到非字母、数字字符为止,以期获取一个尽可能长
的字母数字字符串,而后以此字符串查所谓保存字表(此保存字表要预先造好)
,若查到此
字符串,则拿出相应的类型码;反之,则表示该字符串应为一表记符。
2
v1.0可编写可改正
采纳上述策略后,针对表I中的部分单词能够参照教材P80的图3-22(见图1)
图1辨别表I所列语言中的部分单词的DFA及有关的语义过程图1中所出现的语义变量及语义函数的含义和功能说明以下:
函数GETCHAR:每调用一次,就把扫描指示器目前所指示的源程序字符送入字符变量ch,而后把扫描
指示器前推一个字符地点。
字符数组TOKEN:用来挨次寄存一个单词词文中的各个字符。
函数CAT:每调用一次,就把目前ch中的字符拼接于TOKEN中所存字符串的右侧。
函数LOOKUP:每调用一次,就以TOKEN中的字符串查保存字表,若查到,就将相应重点字的类型码赋
给整型变量c;不然将c置为零。
函数RETRACT:每调用一次,就把扫描指示器回退一个字符地点(即退回多读的那个字符)。
函数OUT:一般仅在进入终态时调用此函数,调用的形式为OUT(c,VAL)。此中,实参c为相应单词
3
v1.0可编写可改正
的类型码助记符;实参VAL为TOKEN(即词文)或为空串。函数OUT的功能是,在送出一个单词的内部表
示以后,返回到调用该词法剖析程序的那个程序。
总的来说,开发一种新语言时,因
原创力文档


文档评论(0)