- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CMM语言词法分析实践报告
词法分析设计文档
词法分析程序的主要流程
输入:文件输入cmm源程序
输出:词法分析结果,分离一个个的单词(token),包括该单词所在行号和所属行
程序构成:主要由三个类构成ScannerGUI.java(主类,实现GUI界面和调用后台程序)
myScanner.java(后台分析程序,主要由语法分析使用)
Token.java(定义单词)
程序内部主要函数:
public char getNextChar()(返回输入流中的一个字符)
public void getTokens()(ScannerGUI调用该方法 分析并输出对整个文件的分析)
public Token getNextToken()(每调用一次返回一个Token实例)
二 识别单词(token)的DFA(共四项)
识别整数(int)和实数(real)的DFA
注释1:整数以正负号(+ -)或者数字(digit)开头,不包含点号(.)
注释2:实数再整数的基础上以正负号(+ -)或者数字(digit)开头,但包含点号(.)
其中点号后面可以没有数字,即523.和523.0是等价的
2.识别注释(comment)的DFA
注释必须以/*开头同时以*/结尾
3.识别标识符(id 、reserved word)的DFA
注释:标识符以字母开头,由字母下划线和数字组成
4.识别特殊字符的DFA
三. 报错为非法的单词
数字:数字以字母结尾,如:1245aaaa; 12.35aaaa
注释格式不完整,如缺少 */
标识符报错 如不能以下划线结尾形如:as_12_为非法
非法的字符出现在 非注释内容中 比如 ¥
中文分号 ;
符号@ 等等均为非法符号
但是在注释中¥…均是合法的,注释内容将被编译器忽略
四.增加的功能:识别单行注释
在cmm代码行中形如 //comments here 将被忽略
五.测试用例
见附件
六.试验总结
完成了对单词(Token)的分析,对非法的单词报错等基本的词法分析功能。
文档评论(0)