自然语言理解讲义第三章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自然语言理解讲义 第三章 特征与扩充文法 主要内容 特征系统与扩充文法 英语基本特征系统 词语形态分析与词典 一个带特征的文法及其分析 扩充转移网络 通用特征系统与合一文法 特征系统与扩充文法(1) 语言中成分之间的搭配需要满足一定的约束,普通的上下文不容易处理这样的情况,需要进行扩充。例如,对于规则NP?ART N,在处理英语句子时可改写为 NP-s?ART-s N-s 及 NP-p?ART-p N-p s与p分别表示单数与复数。 这样显然很麻烦。 另一种方法是定义成分的特征。例如用特征NUMBER(取值可以是s(单数)或p(复数))可对上诉特征进行如下扩充 NP?ART N仅当NUMBER1与NUMBER2一致时适用 特征系统与扩充文法(2) 特征系统与扩充文法(3) 某些复杂特征结构的特征值可以是另一特征结构。这时需要用一些特殊的特征名:1、2、3等等,来表示第一个子成分、第二个子成分、第三个子成分…。例如名词短语a fish的特征结构可表示如下 NP1: (NP NUMBER s 1 (ART ROOT a NUMBER s) 2 (N ROOT fish NUMBER s)) 也可以用后面的分析树的形式来表示。 特征系统与扩充文法(4) 特征系统与扩充文法(5) 扩充文法中的重写规则将采用特征结构。而且,规则中的特征值往往需要采用变量的形式,例如关于简单名词短语的规则可表示为 (NP NUMBER ?n)?(ART NUMBER ?n) (N NUMBER ?n) 这就是说,NP成分可以包含两个子成分,其中第一个子成分是ART,第二个是N;而这三个成分的NUMBER (数)特征必须相同。在规则中引入特征值变量,使规则的适用范围更广泛。 特征系统与扩充文法(6) 根据这条规则,NP1是合法的成分。而 *(NP 1 (ART NUMBER s) 2 (N NUMBER s)) 不能被规则所接受,因为NP没有NUMBER特征。 成分 *(NP NUMBER s 1 (ART NUMBER s) 2 (N NUMBER p)) 也不合理,因为N的NUMBER特征的值与其他成分的NUMBER特征值不同。 特征系统与扩充文法(7) 变量在表达成分的二义性方面也很有用。例如单词fish既可以是单数也可以是复数,这样在词典中可表示为 (N ROOT fish NUMBER ?n) 以说明fish的NUMBER特征可取(取值范围内的)任意值。 在更多情况下,某特征能取的值是一个范围(可能取值集合的子集),而不是任意值。这时可采用约束变元来进行表示:在变元后面用一个表将变元能取的值全部列出来。例如?n{s p}表示变元?n只能取值s或p。因而单词fish可表示为 (N ROOT fish NUMBER ?n{s p}) 甚至简单表示为 (N ROOT fish NUMBER {s p}) 英语基本特征系统(1) 人称和数 主语和(主)动词除了在数上要一致以外,在人称(person)上也要一致。特征person的可能值包括: 第一人称(First Person(1)): 第二人称(Second Person(2)): 第三人称(Third Person(3)): 人称和数经常一起出现,所以通常把它们合在一起用一个特征AGR来表示。AGR有6个可能值:第一人称单数(1s),第二人称单数(2s),第三人称单数(3s),第一人称复数(1p),第二人称复数(2p),第三人称复数(3p)。 are的AGR特征的取值可为{2s, 1p, 2p, 3p}。 英语基本特征系统(2) 动词形式 英语中动词有时态的变化,动词形式用特征VFORM表示,其取值包括: base—动词原型 pres—一般现在时 past—一般过去时 fin—限定式(finite,等价于{pres, past}) ing—现在进行时 pastprt—过去完成时 inf—不定式 英语基本特征系统(3) 动词次范畴 动词次范畴特征,SUBCAT,用来处理词与其补足语之间的相互作用。为方便记忆,SUBCAT的值由补足语中各部分的主要语法类所组成。若某语法类的值被限定为一特征值,则在类名之后加一冒号,然后紧跟该值。如SUBCAT值_np_vp:inf用来表示由一NP跟一个动词不定式(即VFORM为inf的VP)所组成。而

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档