自然语言处理-第9章 句法和语义的关系.ppt

自然语言处理-第9章 句法和语义的关系.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
自然语言处理-第9章 句法和语义的关系

为了处理这两种情况,我们需要为每个词条加入一个新的特征ROLES,这样就有如下的文法规则: (VP VAR ?v SEM (λa (?semv ?v[AGENT a][THEME ?semnp]))) → (V ROLES AG-THEME SEM ?semv) (NP SEM ?semnp) (VP VAR ?v SEM (λa (?semv ?v[INSTR a][THEME ?semnp])))→ (V ROLES INSTR-THEME SEM ?semv) (NP SEM ?semnp) 这样我们需要为动词可能充当的所有角色加入上述的附加规则。 举个例子,考虑如何确定一个文法,用它产生基于主题角色(thematic role)的逻辑形式。先考虑如果字典中只存储单个词的意思,那将会出现什么情况呢?前面用的文法只用一条规则可以覆盖所有的及物动词,新的文法则需根据及物动词所充当的主题角色来分类,每一种情况一条规则。例如动词see和eat,这两个都有及物动词的形式,此时,主语充当AGENT角色,宾语充当THEME角色。另一个方面,动词break,它的主语充当INSTR角色,宾语充当THEME角色,象在句子The hammer broke the window.中就是这样。 显然,这种方法很笨重,因为它要在字典中加入主题角色的信息 (用 ROLES特征),它可以简化成只在字典中为那些合适的形式进行编码,例如,如果词条为: see: (V VAR ?v SEM (λo (λa (SEES1 ?v [AGENT a][THEME ?o])))) break: (V VAR ?v SEM (λo (λa (BREAKS1 ?v [INSTR a][THEME ?o]))) 这样一个简单的文法规则如下: (VP SEM (?semv ?semnp]))→ (V SEM ?semv) (NP SEM ?semnp) 它将覆盖所有的情况。 考虑动词短语see the book,其中see的SEM特征和上面一样,the book的SEM为THE b1 (BOOK b1),那么VP的SEM特征为: ((λ o (λa (SEES1 b1 [AGENT a][THEME ?o]))) THE b1 (BOOK b1)) 用λ变换可以简化为 (λa (SEES1 b1 [AGENT a] [THEME THE b1 (BOOK b1)])) 对于动词短语break the book,我们可以用上面的break的SEM特征和the book的SEM特征,利用同样的规则产生简化的逻辑形式: (λa (BREAKS1 b1 [INSTR a] [THEME THE b1 (BOOK b1)])) 在制作字典时所碰到的问题是有很多单词,即使词条很简单,确定一个字典也是很困难的。就是只为最普通的意思规定语义理解规则,这样的工作也是很烦人的,因为对于动词的每一个补充结构都要有不同的语义理解规则。 ★ 分级词条 例4 如果每个动词都要这样重复,那将是个很大的负担。幸运的是,我们可以利用英语中动词的一些普遍的规律性,例如,英语中有一大类动词,包括大部分及物动词,它们都用相同的语义理解规则:其SUBCAT为_np的形式。这种类型的动词,如give,take,see,find,paint等等,——实际上都描述某种动作。 在分级的顶部是抽象的动词意思,它定义一般动词类,如抽象类 INTRANS-CAT定义一类的动词,它允许SUBCAT为 _none并且有语义理解规则: λ s (?PREDN *[AGENT s]) . 其中?PREDN是一个由动词决定的谓词名,除了它还须确定外,这条规则已明确地描述不及物动词(如run,laugh,sit等等)的语义理解。 分级字典 (hierarchical lexicon)的思想是简练地获得动词的共同性质,用这种方法来组织动词的意思。这要依靠继承 (inheritance)这项技术,单词的意思得到继承或在分级中获得抽象类的性质,例如一个很有用的分级词条可以基于动词的SUBCAT和SEM性质。 另外一个共同的形式是简单的及物动词,包括上面所列的动词,这种形式,TRANS-ACT则有一个SUBCAT为_np和一个SEM为λo λ a (?PREDN *[AGENT a][THEME o])。 我们可以为所有的具有共同形式的动

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档