- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章节文法和语言
第2章 文法和语言 主要内容 § 2.1 语言和文法的直观概念 § 2.2 符号和符号串 § 2.3 文法和语言的形式定义 § 2.4 文法的类型 § 2.5 上下文无关文法及其语法树 § 2.6 句型的分析 § 2.7 有关文法中的一些说明 §2.1 语言和文法的直观概念 程序设计语言的定义 语言是一个记号系统。 汉语--符合汉语语法的句子的全体 英语--符合英语语法的句子的全体 程序设计语言--该语言的程序的全体 程序设计语言由语法和语义定义: 语法(syntax) 定义: 是一组规则,用它可以形成和产生一个合适的程序 描述工具:文法 作用: 定义什么样的符号序列是合法的,与符号的含义无关。 语义(semantics) 分类: 静态语义:一系列限定规则,确定哪些合乎语法的程序是合适的 动态语义:表明程序要做什么 描述工具: 指称语义,操作语义等 作用: 检查类型匹配,变量作用域等 文法的直观概念 §2.2 符号和符号串 字母表 定义:元素的非空有穷集合 例:∑={0?1} Α={a?b,c} 元素也称为符号,字母表也称符号集。 程序语言的字母表由字母数字和若干专用符号组成。 符号串 定义:由字母表中的符号组成的任何有穷序列 例: 0,00,10是字母表∑={0,1}上的符号串 a,ab,aaca是Α={a,b,c}上的符号串 在符号串中,符号是有顺序的,顺序不同,代表不同的符号串,如:ab和ba不同 不含任何符号的符号串称为空串,用ε表示 注意:{ε}并不等于空集合{ } 符号串长度: 符号串中含有符号的个数 如: |abc|=3 | ε|=0 子符号串 设有非空符号串u=xvy,其中符号串 ,则称v为符号串u的子符号串。 符号串的头与尾 如果z=xy是一个符号串,则x是z的头,而y是z的尾。如果y非空,则x是z的固有头;如果x非空,则y是z的固有尾。 符号串的运算 符号串的连接:设x、y是符号串,它们的连接是把y的符号写在 x的符号之后得到的符号串xy 例如 x=ST,y=abu ,则 xy=STabu 显然εx = xε=x 符号串的方幂:把符号串a自身连接n次得到的符号串an = aa…aa 例如 a1=a a2=aa a0=ε 符号串集合: 定义: 若集合A中所有元素都是某字母表?上的符号串,则称A为字母表?上的符号串集合。 符号串集合的乘积:符号串集合A和B的乘积定义为: AB ={xy|x∈A且y∈B},即AB是由A中的串x 和B中的串y连接而成的串xy组成的集合。 若集合A = ?ab,cde? B = ?0,1? 则 AB = ?ab0,ab1,cde0,cde1? 显然 {ε}A = A{ε} = A 符号串集合的方幂: 设A是符号串的集合,则称Ai为符号串集A的方幂,其中i是非负整数。具体定义如下: A0 ={ε } A1 = A , A2 = A A AK = AA......A(k个) 集合的闭包 闭包 集合Σ的闭包Σ *定义如下: Σ * = Σ 0∪ Σ1∪ Σ 2∪ Σ 3∪… 例:设有字母表Σ={0,1} 则Σ*=Σ0∪Σ1∪Σ2∪… ={ε,0,1,00,01,10,11,000,…} 即Σ*表示Σ上所有有穷长的串的集合。 正闭包 Σ+ = Σ1∪Σ2∪Σ3∪…称为Σ的正闭包。 ?+ 表示?上的除ε外的所有用穷长串的集合 Σ* = Σ0∪Σ+ Σ+ = ΣΣ* = Σ* Σ 小结 1 符号与字母表 2 符号串 3 符号串的运算 4 符号串集合 5 集合的闭包 6 字母表的闭包 §2.3 文法和语言的形式定义 1.文法的定义 2.文法形式上的约定 3.推导与归约 4.句型、句子、语言的定义 5.文法的等价 1.文法的定义“我是大学生”是汉语的一个句子 用::=表示的汉语句子的构成规则: 〈句子〉∷=〈主语〉〈谓语〉 〈主语〉∷=〈代词〉|〈名词〉 〈代词〉∷= 我|你|他 〈名词〉∷= 王明|大学生|工人|英语 〈谓语〉∷=〈动词〉〈直接宾语〉 〈动词〉∷= 是|学习 〈直接宾语〉∷=〈代词〉|〈名词〉 关键思路 从文法的开始符号出发, 反复使用产生式,对非终结符进行替换(展开), 直到整个字符串中不在包含非终结符。 这时,得到了这个文法的一个句子(一个程序) 这个过程称为推导 文法的定义 包括四个组成部分: 一组终结符号(不能被替换的符号,单词符号) 一组非终结符号(能够被替换为终结符号或非终结符号,语法单位) 一个开始符号(从这个
原创力文档


文档评论(0)