面向中文信息处理NV结构句法语义研究.docVIP

面向中文信息处理NV结构句法语义研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向中文信息处理NV结构句法语义研究

面向中文信息处理NV结构句法语义研究   摘 要:立足于面向计算机的语言本体研究,从切分语料中选择数条N+V结构,从句法、语义和语用特征的角度探索该结构形成歧义的原因,找寻搭配两个成分的搭配规则,并将之形式化,进而制定相应的机用识别策略,从而提升计算机对该结构进行分析的能力。   关键词:中文信息处理 “N+V”结构 自动消歧   “N+V”格式是一种比较常见的同形异构结构,虽然表层形式简洁,从层次划分上不存在困难,但是内部可能存在不同的语法关系、语义关系。   一、“N+V”结构本体分析   (一)“N+V”结构的语法关系   本文所指“N+V”结构是指可以自足的、无其他成分或标记的合法语言单位,不包括“把N+V了”“N的V”等结构形式。根据冯志伟先生的潜在歧义理论,我们将这种结构底层存在的语法关系区分如下:   主谓关系,其中“N”作主语,“V”作谓语,二者之间是陈述与被陈述的关系,如:粮食丰收、妈妈做饭、小二黑结婚;   偏正关系,其中“N”为修饰语,“V”是中心语,如:口头创作、直线上升、文艺演出、汽车制造、语言研究、核试验;   既可以分析成主谓关系也可以分析成偏正关系,这种结构在没有给定语境时会产生理解上的歧义,如:机器生产、专业人员培训。   其中,前两种属于“格式真歧义短语”,它们具有相同的表层类型形式,但是对应着两种句法功能结构,计算机在处理时不能判断采取哪种句法结构,就会产生两种结果,而这种歧义对人来说是不存在的;最后一种属于“实例真歧义短语”,即实例化后产生的短语对应至少两种句法结构,这种歧义对人和计算机都是存在的。   除此之外,由于已经给定短语格式,其中成分的词类已经确定,不会作为结构歧义的产生原因;另一方面,只涉及两个成分的“N+V”结构,词与词搭配时不会产生不同的结构层次,也就不会成为结构歧义的产生原因。   (二)“N+V”结构的语义、语用关系   “N”和“V”之间的语义关系不止一种,“N”既可以作为施事支配“V”,又可以作为“V”的受事受到“V”的支配,还可以作为状语修饰“V”,当同一个结构能够分析出不同关系时就会产生歧义。如“机器”既可以作为“生产”动作的对象,又可以作为“生产”动作的施行者,就会产生歧义。因此,我们可以认为,不及物动词只能构成主谓结构和部分状中结构,而不会产生歧义,只有“V”可以带宾语并且能带体词性宾语时,才会反过来支配前面的“N”,才会产生理解上的区别。如“专业人员培训”中的“培训”是及物动词,“专业人员”既可以作为状语,表示“培训”动作的执行者,又可以作为宾语,表示“培训”动作的对象。   当进入结构的“N”和“V”之间构成动作与受事、对象关系时,有可能构成定中结构。当进入结构的“N”和“V”之间构成施事主体与动作关系时可能构成主谓结构。当这两种关系同时存在时,就会构成歧义结构,这也是歧义格式中最常见的双重歧义关系,还有一些歧义结构的语义关系比较特殊,如:西部开发(“N”既是客体又是地点)、每个人都给一本书(“N”既是主体又是与事)。而当这两种关系都不存在时,“N”通常表示“V”的某种方式、手段,或是动作的时间、原因、范围等,此时构成偏正结构中的另一种――状中结构。   名词性的“N+V”结构还具有一种特殊的语篇特征,即“N”失去话题性,不能被回指,而“V”失去谓词性,得到指称意义,有时可以被数量词修饰,如:一项季度考核、一份会议记录。据此,整个结构就产生指称的语义效果,具有类别义和概念性的倾向,伴随着“N”的改变,类别也会发生变化。   根据现有“N+V”结构的研究成果来看,学者们对定中式的研究比较多,其讨论主要集中在此结构的性质、产生机制和限制条件方面。   对于进入定中结构的“N”的限制条件,李晋霞提出高生命度、高个体度的名词不易进入;缺省宾语不能进入;区别性的下位名词更易进入;概念信息非常具体的“N”不易进入。耿国锋则提出语义抽象、泛化,分布上失去名词形态特征的名词比较容易进入,还有抽象名词、集合名词较容易进入。对于“V”的限制条件,马真、陆俭明《“名词+动词”词语串浅析》中提出四类排斥进入主谓结构的动词:企图类、成为类、“使”类和“着想”类;并提出进入偏正结构的动词必须是名动词。李晋霞则提出:强动作动词、特征动词、口语动词、黏着动词、不及物动词不易进入,但可以举出很多反例。耿国锋提出,动作具有无界性的动词、非完成性和非瞬时性的动词、及物性降低的动词比较容易进入,且进入后失去动词的典型句法功能。但是,名词性“N+V”结构处在不稳定的发展变化中,许多曾经排斥的情况已经有为数不少的用例,需要重新考虑相应的规则。   这些限制条件具有启发价值,但其中某些概念比较模糊,有些对音节的限制几乎只是现象描写,还有一些从词类角度总结

您可能关注的文档

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档