- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
自然语言处理-第4章 特征和增强的文法
第四章 特征和增强的文法 * * 前一章讲的上下文无关文法为迄今为止开发的大多数计算分析机构提供了基础。但仅使用最基本的上下文无关文法要处理自然语言将是很不方便的。在本章中将描述基本上下文无关机制的一种扩展,它使用一组特征来定义成分。这种扩展使我们能够用一种直觉而简洁的方法来处理自然语言中诸如一致性和子类等的方面的问题。 4.1 特征系统和增强的文法 4.2 英语的一些基本特征系统 4.3 词法分析和辞典 4.4 一个使用特征的简单文法 4.5 使用特征进行分析 4.6 增强的转移网络 4.7 确定子句文法(Definite Clause Grammar) 4.8 扩展的特征系统和合一文法 结束放映 4.1 特征系统和带参数的文法 自然语言中的一致性限制及特征系统的引入 自然语言中在词与词之间,短语与短语之间经常有一致性限制。例子:a men不是一个合法的英语短语。 主要几种一致性形式:数的一致性(number agreement)、主语-动词的一致性(subject-verb agreement)、代词的性一致性(gender agreement)以及短语中主词与补充成分之间的限制等。 为了方便地处理一致性的现象,语法形式应进行扩展以使的成分(constituent)可以带有特征(feature)。 例子:引入特征NUMBER后可写如下增强的CFG: NP?ART N 仅当NUMBER1和NUMBER2一致 若不采用特征,上述的文法规则可以等价于下面两条规则,但显然这样将使得文法的大小加倍: NP-SING?ART-SING N-SINGER NP-PLURAL?ART- PLURAL N-PLURAL 结论:使用特征将既保持文法大小又能处理一致性限制。 特征结构介绍 特征结构(feature structure):定义成分(constituent)相关属性的从特征(feature)到值(value)的映射关系。 例子:ART1: (CAT ART ROOT a NUMBER s) 一种简写方式:ART1: (ART ROOT a NUMBER s) 特征结构可以用来表示更大的成分,这时特征结构本身可以作为值。基于整数(1、2、3…)的特殊特征代表第几(1、2、3…)个的子成分 例子: NP1: (NP NUMBER s 1(ART ROOT a NUMBER s) 2(N ROOT fish NUMBER s)) NP ART N s a fish a s NUMBER NUMBER ROOT ROOT NUMBER 2 1 用特征结构描述增强的文法规则 有了特征结构后就可以用它们来描述增强的语法规则。为了使一条规则能够适用一个较宽范围的情况,我们将允许变量(variable)作为特征值。 例如:(NP NUMBER ?n)?(ART NUMBER ?n) (N NUMBER ?n) 根据上述规则,下面的成分将不是合法成分: (NP 1(ART NUMBER s) (NP NUMBER s 2(N NUMBER s)) 1(ART NUMBER s) 2(N NUMBER p)) 变量还可以用来表明成分中的歧义。 例如:fish可以作为单数或复数,可以在辞典中为之定义两个条目,也可以使用变量而仅定义如下单一的条目: (N ROOT fish NUMBER ?n) 受限变量(constrained variable):其值只能取自特定序列的变量。例如:(N ROOT fish NUMBER ?n{s p}) 可以简化为:(N ROOT fish NUMBER {s p}) 返回 4.2 英语的一些基本特征系统 人称与数(Person and Number)特征 前面的章节中我们已经看到英语中
文档评论(0)