2文法和语言的形式定义.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言及其文法 计算机科学系 李静 本章主要内容 语言概述 基本定义 文法(Grammar)的定义 CFG的分析树(Parse Tree) 文法的分类 文法的构造 语言概述 什么是语言? 语言概述 语言特征 自然语言(Natural Language) 是人与人的通讯工具 环境、背景知识、语气、二义性 鲁迅对《红楼梦》的评价 单是命意,就因读者的眼光而有种种:经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家 看见宫闱秘事 。 计算机语言(Computer Language) 计算机系统间、人机间通讯工具 严格的语法(Grammar)、语义(semantics) 语言概述 语言的描述方法——现状 自然语言:自然、方便-不易形式化 计算机语言:严格、准确-易于形式化 形式化描述 高度的抽象,严格的数学理论基础和方便的计算机表示 语言概述 自然语言——形式化的内容提取 语言(Language):满足一定条件的句子集合 句子(Sentence):满足一定规则的单词序列 单词(Token):满足一定规则的字符(Character)串 自然语言语言是字和组合字的规则 例: 第译始一天课今开编上节 今天开始上第一节编译课 语言概述 语言概述 程序设计语言——形式化的内容提取 程序设计语言(Programming Language):组成程序的所有语句的集合。 程序(Program):满足语法规则的语句序列。 语句(Sentence) :满足语法规则的单词序列。 单词(Token) :满足词法规则的字符串。 例: 变量=表达式 if 条件then 语句 while条件do 语句 语言概述 形式化语言理论 用数学方法研究自然语言(如英语)和人工语言(如程序设计语言)的产生方式、一般性质和规则的理论。 描述形式——文法 语法——语句 语句的组成规则 描述方法:BNF范式、语法(描述)图 词法——单词 单词的组成规则 描述方法:BNF范式、正规式 形式化语言 语言学家Chomsky最初从产生语言的角度研究语言。 1956年,通过抽象,他将语言形式地定义为是由一个字母表中的字母组成的一些串的集合。可以在字母表上按照一定的规则定义一个文法(Grammar),该文法所能产生的所有句子组成的集合就是该文法产生的语言。 克林(Kleene)在1951年到1956年间,从识别语言的角度研究语言,给出了语言的另一种描述。 克林是在研究神经细胞中,建立了自动机,他用这种自动机来识别语言:对于按照一定的规则构造的任一个自动机,该自动机就定义了一个语言,这个语言由该自动机所能识别的所有句子组成。 形式化语言 1959年,Chomsky通过深入研究,将他本人的研究成果与克林的研究成果结合了起来,不仅确定了文法和自动机分别从生成和识别的角度去表达语言,而且证明了文法与自动机的等价性。 20世纪50年代,人们用巴科斯范式(Backus Nour Form 或Backus Normal Form,简记为BNF)成功地对高级语言ALGOL-60进行了描述。实际上,巴科斯范式就是上下文无关文法(Context Free Grammar)的一种表示形式。这一成功,使得形式语言在20世纪60年代得到了大力的发展。 形式化语言 形式语言与自动机理论除了在计算机科学领域中的直接应用外,更在计算学科人才的计算思维的培养中占有极其重要的地位。 计算思维能力的培养,主要是由基础理论系列课程实现的,该系列主要由从数学分析开始到形式语言结束的一些数学和抽象程度比较高的内容的课程组成。 它们构成的是一个梯级训练系统。在此系统中,连续数学、离散数学、计算模型等三部分内容要按阶段分开,三个阶段对应与本学科的学生在大学学习期间的思维方式和能力的变化与提高过程的三个步骤。 计算思维能力的培养过程 文法 文法 阐明语法的一种工具 形式化语言理论的基本概念 以有穷的集合刻画无穷的集合 一个形式化例子 句子 → 主语 谓语 主语 → 名词 | 代词 谓语 → 动词 宾语 宾语 → 名词 | 代词 名词 →小张|小王|小李|学生|篮球 代词 →我|你|他 动词 →是|打 基本定义 字母表 字母表(Alphabet)Σ是一个非空有穷集合,字母表中的元素称为该字母表的一个字母(Letter),也叫字符(Character)。 例:以下是不同的字母表: {a,b,c,d} { a,b,c,……,z} {0,1} ASCII字母表 基本定义 符号串的定义 (1) ε是Σ上的一个符号串。 (2) 若x是Σ上的符号串,而a是Σ的元素,则xa是Σ上的符号串。 (3) y是Σ上的符号串,当且仅当它由(1)和(2)导出。 由字母表中的符号所组成的任何有穷序列被称之为该字母表上的符号串。 基本定义 符

文档评论(0)

好文精选 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档