- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
形式语言复习资料
形式语言与自动机理论
文法
2.1 文法的形式定义
文法(grammar)
G=(V,T,P,S)
V——为变量(variable)的非空有穷集。A∈V,A叫做一个语法变量(syntactic Variable),简称为变量,也可叫做非终极符号。它表示一个语法范畴。所以,本文中有时候又称之为语法范畴。
T——为终极符(terminal)的非空有穷集。a∈T,a叫做终极符。由于V中变量表示语法范畴,T中的字符是语言的句子中出现的字符,所以,有V∩T=Φ。
S——S∈V,为文法G的开始符号(start symbol)。
P——为产生式(production)的非空有穷集合。P中的元素均具有形式α→β,被称为产生式,读作:α定义为β。其中α∈(V∪T)+,且α中至少有V中元素的一个出现。β∈(V∪T)*。α称为产生式α→β的左部,β称为产生式α→β的右部。产生式又叫做定义式或者语法规则。
约定
⑴ 对一组有相同左部的产生式
α→β,α→β ,… ,α→β
可以简单地记为:
α→β|β|…|β
读作:α定义为β,或者β,…,或者β。并且称它们为α产生式。β,β,…,β称为候选式(candidate)。
⑵ 使用符号
英文字母表较为前面的大写字母,如A,B,C,…表示语法变量;
英文字母表较为前面的小写字母,如a,b,c,…表示终极符号;
英文字母表较为后面的大写字母,如X,Y,Z,…表示该符号是语法变量或者终极符号;
英文字母表较为后面的小写字母,如x,y,z,…表示由终极符号组成的行;
希腊字母α,β,γ…表示由语法变量和终极符号组成的行
推导(derivation)
设G=(V,T,P,S)是一个文法,如果α→β∈P,γ,δ∈(V∪T)*,则称γαδ在G中直接推导出γβδ。
γαδγβδ
读作:γαδ在文法G中直接推导出γβδ。
“直接推导”可以简称为推导(derivation),也称推导为派生。
归约(reduction)
γαδγβδ
称γβδ在文法G中直接归约成γαδ。在不特别强调归约的直接性时,“直接归约”可以简称为归约。
使用产生式→A
SAB使用产生式→AB
A0使用产生式→0
A0A使用产生式→0A
A00A使用产生式→0A
…
A000…0使用产生式→0
语法范畴A代表的集合L(A)={0,00,000,0000,……}={0|n≥1};
语法范畴B代表的集合L(B)={1,11}
语法范畴S代表的集合L(S)=L(A)∪L(A)L(B)
={0,00,000,0000,…}∪{0,00,000,0000,…}{1,11}
={0,00,000,0000,…}∪{01,001,0001,00001,…}∪{011,0011,00011,000011,…}
语言(language)
L(G)={w | w∈T*且Sw}
句子(sentence)
?w∈L(G),w称为G产生的一个句子。
句型(sentential form)
G=(V,T,P,S),对于α∈(V∪T)*,如果Sα,则称α是G产生的一个句型。
2.2 文法的构造
例1 构造文法G,使L(G)={0,1,00,11}
构造:({S},{0,1},{S?0,S?1,S?00,S?11},S)
({S,A,B},{0,1},S→0)
例2 构造文法G,使L(G)={w w|w∈{0,1,2,3}+}
S→HE
H→0|1|2|3|0H|1H|2H|3H
E→0|1|2|3|E0|E1|E2|E3 难以生成L(G)。
根据{w w|w∈{0,1,2,3}+}的句子的特点(对应位置相等),设w=aa…a,从而有w= a…aa,故ww= aa卆 EMBED Equation.KSEE3 \* MERGEFORMAT a卆 EMBED Equation.KSEE3 \* MERGEFORMAT a ,满足f(w wT,i)=f(w wT,|w wT|-i+1)。
递归地定义L
⑴ 对a∈{0,1,2,3},aa∈L;
⑵ 如果x∈L,则对a∈{0,1,2,3},axa∈L;
⑶ L中不含不满足(1)、(2)任何其他的串。
根据递归定义中的第一条,有如下产生式组:
S→00 | 11 | 22 | 33
再根据递归定义第二条,又可得到如下产生式组:
S→0S0 | 1S1 | 2S2 | 3S3
从而,G1:S→00 | 11 | 22 | 33 | 0S0 | 1S1 | 2S2 | 3S3
2.3 文法的乔姆斯基体系
文法G=(V,T,P,S)
G叫做0型文法,也叫做短语结构文法(,PSG)。
L(G)叫做0型语言。也可以叫做短语结构语言(PSL)。
如果对于α→β
文档评论(0)