- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
词法分析器说明文档.doc
词法分析器说明文档
宋波
词法规则
关键字: 本程序识别的关键字为int real if then else while,仅当单独出现
以上标识符时识别为关键字,对于inta,ifb等识别为标识符。
标识符: 一个标识符必须以字母开头,后面接上字母和数字,否则产生报错信息,程
序停止词法分析,输出相关错误信息
如: 正确:abc, abc123, 等
错误:123abc
操作符: 本程序识别的操作符为: + - / * = == = = !=
当 !后跟其它字符时产生出错信息。
分隔符: 本程序识别的分隔符为: ( ) { } ;
数字: 识别的数字遵循以下文法规则:
digit ( 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
intnumber ( digit+
exponent ( E ( + | - | ( ) digit+
fraction ( . digit+
realnumber ( digit+ exponent | digit+ fraction ( exponent | ( )
例如:正确: 123, 123E2, 123.3123.3E4
错误: 123A,123E, 123.A . 123.3A, 123.3E
注释符: 注释部分以 // 本程序对其不进行识别.
引入文件 为 #include**形式,其他做出错处理
设计思路
本程序采用字符流形式读入文件,识别其中的关键字,标识符,分隔符,注释符,引入文件声明等.
设计了一个灵活的读取字符的自动机为如下图所显示
词法分析部分的Lexical类如下:
public class Lexical
{
private int rnum;//行号
private int rpos;//列号
private static ArrayList symbolTable;
private StreamReader br;
private char c;
private char bC;
private int state;
private String str;
public Lexical(StreamReader br)
{
symbolTable = new ArrayList();
this.br=br;
c= ;
bC= ;
state = 0;
rnum=1;
rpos=0;
str=;
}
public ArrayList getSymbolTable()
{
c = nextChar();
state = 0;
analyzer();
return symbolTable;
}
private void analyzer()
{
bool isRunning=true;
while(isRunning)
{
switch (state)
{
case 0:
if(c== ) //空格
{
}
else if(c==\t) //tab
{
rpos+=3;
}
else if((int)c==13) //空格
{
}
else if((int)c==10) //回车
{
rpos = 0;
rnum++;
}
else if(c==~) //结束符
{
re
文档评论(0)