- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工学]编译原理实验指导书
《编译原理》课程实验指导书
计算机学院编
2007年9月
实验一 C语言子集编译程序
一、实验目的
用C语言对一个C语言的子集编制一个一遍扫描的编译程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。
1.设计、编制并调试一个词法分析程序,加深对词法分析原理的理解。
2.编制一个递归下降分析程序,并对C语言的简单子集进行分析。
3.通过上机实习,加深对语法制导翻译原理的理解,掌握将语法分析所识别的语法成分变换中间代码的语义翻译方法。
二、实验要求、内容及学时
词法分析部分:2学时
(一)待分析的C语言子集的词法:
1.关键字
main if else int return void while
所有关键字都是小写。
2.专用符号
= + - * / = = == != ; : , { } [ ] ( )
3.其他标记ID和NUM
通过以下正规式定义其他标记:
ID→letter(letter|digit)* NUM→digit(digit)*
letter→a|…|z|A|…|Z digit→0|…|9
4.空格由空白、制表符和换行符组成
空格一般用来分隔ID、NUM、专用符号和关键字,词法分析阶段空格通常被忽略。各种单词符号对应的类别码:(采用一符一类别码,见下表)
单词符号 类别码 单词符号 类别码 单词符号 类别码 main 1 - 23 ; 34 int 2 * 24 35 char 3 / 25 36 if 4 ( 26 = 37 else 5 ) 27 = 38 for 6 [ 28 == 39 while 7 ] 29 != 40 ID 10 { 30 ‘\0’ 1000 NUM 20 } 31 ERROR -1 = 21 , 32 + 22 : 33 (二)词法分析程序的功能:
输入:所给文法的源程序字符串。
输出:二元组(syn,token或sum)构成的序列。其中,
syn 为单词类别码。
token 为存放的单词自身字符串。
sum 为整型常量。
具体实现时,可以将单词的二元组用结构进行处理。
例如:对源程序
main()
{
int i=10;
while(i) i=i-1;
}
的源文件,经词法分析后输出如下序列:
(1,main) (26,() (27,)) (30,{) (2,int) (10,i) (21,=) (20,10)
(34,;) (7,while) (26,() (10,i) (27,)) (10,i) (21,=) (10,i)
(23,-) (20,1) (34,;) (31, })
(三)词法分析程序主要算法思想:
算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。
1.主程序示意结构图(如下):
置初值 调用扫描子程序
输出单词二元组 直至输入串结束 注:
①关键字表初值
关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字),当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表可处理为一个字符串数组(实际为指向字符数组的指针数组),其描述如下:
char *KEY_WORDS[8]=
{“main”,”int”,”char”,”if”,”else”,”for”,”while”};
为分析方便,这里把main作关键字处理。
②程序中需要用到的主要变量:syn,token和sum。
2.扫描子程序(scaner)的算法思想
首先设置三个变量:token用来存放构成单词符号的字符串;sum用来存放整型单词;syn用来存放单词的类别码。扫描子程序主要部分N—S图如下:
变量初始化 忽略空格 文件是否结束 T F 是否字母 T F 拼字符串 是否数字 是否关键字 T F T F 拼数 是否运算符、界符等符号 syn为对应关键字的类别码 syn=10 syn=20 T F 给出相应的syn值 报错 语法分析部分:2学时
(一)待分析的C语言子集的语法
用扩充的BNF表示如下:
1.程序→main()语句块
2. 语句块→’{‘语句串’}’
3. 语句串→语句{;语句};
4. 语句→赋值语句|条件语句|循环语句
5. 赋值语句→ID=表达式
6. 条件语句→if(条件表达式)语句块
7. 循环语句→while(条件表达式)语句块
8. 条件表达式→表达式关系运算符表达式
9. 表达式→项{+项|-项}
10.项→项{*因子|/因子}
11.因子→ID|N
文档评论(0)