- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
编译原理与实践-第2章 词法分析
第2章 词法分析;2.1 词法分析器的作用;任务:逐个读入源程序字符并按照构词规则切分成一系列单词。单词是语言中具有独立意义的最小单位,包括保留字、标识符、运算符、标点符号和常量等。
识别出源程序中的单词;
删除无用的空白字符及注释(空格、回车 等),这些信息仅增加了源程序的可读性,便于程序员阅读和维护程序,而对于语法分析是完全无用的。
进行词法检查,能够检测出输入中不能形成源语言任何单词的错误字符串。;The big elephant ate the peanut.; token表示的字符串(串值或词义): if , y, ,3,then,x,=,0;if y3 then x=0;定义逻辑项token的数据类型:
typedef struct ;词法分析程序的函数接口:
TokenRecord getToken(void);;第2章 词法分析;正则表达式:;2.2.1 基本概念和术语
2.2.2 正则表达式的定义
2.2.3 正则表达式基本等价关系
2.2.4 正则表达式的扩展
2.2.5 单词的正则表达式举例;2.2.1 基本概念和术语; 符号串 由字母表中的符号组成的任何有穷序列称为符号串:
例如00, 11, 10 是字母表? ={0,1}上的符号串。
字母表A={a,b,c}上的符号串有: a,b,c,ab,aaca等。
在符号串中,符号的顺序是很重要的,符号串ab就不同于ba,abca和aabc也不同。;符号串的长度 如果某符号串x中有m个符号,则称其长度为m,表示为|x|=m,如001110的长度是6。
空符号串,即不包含任何符号的符号串,用ε表示,其长度为0,即|ε|=0。
;符号串的连接:设x和y是符号串,它们的连接xy是把y的符号写在x的符号之后得到的符号串。
例如 x=ST,y=abu,则它们的连接 xy=STabu,|x|=2,|y|=3,|xy|=5
由于ε的含义,显然有εx=xε=x。
符号串的方幂:符号串自身连接n次得到的符号串xn 定义为 xx…x; n个x x1=x, x2=xx且x0=ε;例;若x=ab 则:
x0 = ε
x1 =ab
x2 = abab
x3 = ababab
xn = xxn-1 = xn-1x (n0);符号串集合:若集合A中所有元素都是某字母表?上的符号串,则称A为字母表?上的符号串集合。
符号串集合的和与积
设A,B为两个符号串集合,定义
和 A+B(或A?B) ={w|w?A,或w?B}
积 AB={xy|x?A,y?B}
; 若用?表示空集,则有:
A+? = ?+A = A
A? = ?A = ?
{?}A = A{?} = A
例:若集合A=?ab,cde? ,集合B = ?0,1?,则AB =?ab1,ab0,cde0,cde1?;;Σ的闭包:用?*表示?上的一切符号串(包括ε)组成的集合,Σ*称为Σ的闭包。
例如:Σ={a,b} Σ*={ε,a,b,aa,ab,ba,bb,aaa,aab,…}
Σ的正闭包:?上除ε外的所有符号串组成的集合记为?+ ,Σ+称为Σ的正闭包。
例如:Σ={a,b} Σ+={a,b,aa,ab,ba,bb,aaa,aab,…};2.2.1 基本概念和术语
2.2.2 正则表达式的定义
2.2.3 正则表达式基本等价关系
2.2.4 正则表达式的扩展
2.2.5 单词的正则表达式举例;正则表达式就是用特定的运算符及运算对象按某种规则构造的表达式。
每个正则表达式代表一个字符串的集合,我们把其称为正则集。
语言(Language)是字符串组成的集合,我们也可以把正则表达式表示的正则集称为该正则表达式表示的语言。;正则表达式和它所表示的正则集(字符串的集合)的递归定义如下:
设有字母表为Σ,辅助字母表Σ’={ф,ε, | , . , * , ( , ) }
;(1)ε和ф是Σ上的正则式,它们所表示的正则集分别为{ε}和{};
(2) 若a∈Σ,则a是Σ上的正则式,它所表示的正则集为{a};
; r|s 是正则式,表示的正则集为
L(r|s)=L(r)∪L(s) ;
rs 是正则式,表示的正则集为
L(rs)=L(r)L(s) ;
r *是正则式,表示的正则集为(L(r))*。
(r) 是正则式,表示的正则集为L(r);;(4)仅由有限次
您可能关注的文档
最近下载
- 《射频识别技术原理与应用实战》全套教学课件.pptx
- 羊的同期发情技术.pptx VIP
- T-CAGHP 035—2018地质灾害排水治理工程设计规范(试行).docx VIP
- 第二批重点监管危险化学品名录.doc VIP
- 劳技课件教学课件.pptx VIP
- Unit 1 I love sports Part 1 (课件)2025-2026学年度外研版(三起)英语四年级上册.pptx VIP
- DBJ43_T393-2022:湖南省房屋建筑和市政工程消防质量控制技术标准.pdf VIP
- 2024年-2025年政工师(初级)理论考试题库及答案(综合题型).pdf VIP
- T∕ZZB 0900-2018 液晶调光玻璃团体标准.pdf VIP
- 朗朗阅读周周练四年级上册(1).pdf VIP
文档评论(0)