第11章-自然语言理解.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 11 章 自然语言理解 第 11 章 自然语言理解 11.1 简单句理解 11.2 复合句理解 11.3 转换文法和转换网络 第 11 章 自然语言理解 11.1.1 理解的实现过程 10.1.1 理解的实现过程 要理解一个语句,需建立起一个和该简单句相对应的机内 表达。而要建立机内表达,需要做以下两方面的工作: (1) 理解语句中的每一个词。 (2) 以这些词为基础组成一个可以表达整个语句意义的结 构。 第 11 章 自然语言理解 第一项工作看起来很容易 , 似乎只是查一下字典就可以 解决。 而实际上由于许多单词有不止一种含义 , 因而只由单 词本身不能确定其在句中的确切含义 , 需要通过语法分析 , 并根据上下文关系才能最终确定 , 例如 , 单词 diamond 有“菱 形”、“棒球场”和“钻石”三种意思 , John saw Susan ' s diamond shimmering from across the room. 中 , 由于“ shimmering ” 的出现 , 则显然“ diamond ” 是“钻石” 的含义 , 因为“菱形”和“棒球场”都不会闪光。 再如在语 I ' ll meet you at the diamond. 第 11 章 自然语言理解 中 , 由于“ at ” 后面需要一个时间或地点名词作为它的宾语 , 显然这里的“ diamond ” 是“棒球场”的含义 , 而不能是其他 含义。 第二项也是一个比较困难的工作。因为要以这些单词为基 础来构成表示一个句子意义的结构 , 需要依赖各种信息源 , 其 中包括所用语言的知识、 语句所涉及领域的知识以及有关该 语言使用者应共同遵守的习惯用法的知识。由于这个解释过程 涉及到许多事情 , 因而常常将这项工作分成以下三个部分来进 行: 第 11 章 自然语言理解 (1) 语法分析。 将单词之间的线性次序变换成一个显示单 词如何与其他单词相关联的结构。语法分析确定语句是否合乎 语法 , 因为一个不合语法的语句就更难理解。 (2) 语义分析。各种意义被赋予由语法分析程序所建立的 结构 , 即在语法结构和任务领域内对象之间进行映射变换。 (3) 语用分析。 为确定真正含义 , 对表达的结构重新加以解 释。 第 11 章 自然语言理解 11.1.2 要进行语法分析 , 必须首先给出该语言的文法规则 , 以便 为语法分析提供一个准则和依据。 对于自然语言人们已提出 了许多种文法 , 例如 , 乔姆斯基 (Chomsky) 提出的上下文无关 文法就是一种常用的文法。 一个语言的文法一般用一组文法规则 ( 称为产生式或重写 规则 ) 以及非终结符与终结符来定义和描述。例如 , 下面就是一 个英语子集的上下文无关文法: 第 11 章 自然语言理解 11.1.2 语法分析 要进行语法分析 , 必须首先给出该语言的文法规则 , 以 便为语法分析提供一个准则和依据。对于自然语言人们已提 出了许多种文法 , 例如 , 乔姆斯基 (Chomsky) 提出的上下文无 关文法就是一种常用的文法。 一个语言的文法一般用一组文法规则 ( 称为产生式或重写 规则 ) 以及非终结符与终结符来定义和描述。 例如 , 下面就是 一个英语子集的上下文无关文法: 第 11 章 自然语言理解 〈 sentence 〉∷=〈 noun 〈 noun 〈 verb phrase 〉〈 verb phrase phrase 〉∷=〈 determiner 〉〈 noun phrase 〉∷=〈 verb 〉〈 noun phrase 〉 | 〈 verb 〈 determiner 〉∷=the|a|an 〈 verb 〉∷ =eats|operats 〈 noun 〉∷=man|student|apple|computer 这个文法有 6 条文法规则 , 它们是用 BNF 范式表示的。其 中带尖括号的项为非终结符 , 第一个非终结符称为起始符 , 不 带尖括号的项为终结符 , 符号“∷ = ” 的意思是“定义为” , 符号“ | ”

文档评论(0)

niupai11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档