基于语法功能匹配地自动句法分析研究.doc

基于语法功能匹配地自动句法分析研究.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于语法功能匹配地自动句法分析研究

基于语法功能匹配的自动句法分析研究-汉语言文学 基于语法功能匹配的自动句法分析研究 徐艳华 摘 要:词类体系的构建,对自动句法分析具有重要的作用。现有的词类体系主要是面向人的,面对计算机这个新的交际伙伴,其研究结果还显得有些粗糙。鉴于此,本文在详细描述3500个高频词的语法功能的基础上,按照“句法功能完全相同即为一类”的原则,构建真正适合自动句法分析的汉语词类体系。 关键词 :语法功能 词类体系 句法分析 一、引言 在过去的语法研究中,有关现代汉语词类问题一直是语言学界关注的焦点。诸多语言学家曾投入大量精力进行深入研究,形成了现代汉语词类体系,但其主要是面向人的,面对计算机这个新的交际伙伴,其研究成果还显得有些粗糙。尤其是随着信息社会对信息自动化处理要求的不断提高,越来越需要计算机能对自然语言进行深层分析,比如文本校对、机器翻译、自动文摘等,而这些深层分析的实现大都离不开句法分析。一般来说,自动句法分析的操作对象是句子或短语的词类标记序列,“客观的句法分析只能根据词类的标记序列来推知句法结构,如果词类问题没有解决好,或者词类和句法分析脱钩,那就无法根据词类序列去分析句法结构,这样就会影响整个语法体系的科学性和实用价值。”①由此看来,要进行自动句法分析,除了要为计算机提供必要的语义知识、词语搭配知识以及关于客观世界的知识外,更重要的是要为其提供比较完备的语法知识,尤其是语法基础的词类知识。从20世纪80年代中后期开始直到现在,研究人员已经在汉语词语的语法功能分类和属性特征描述方面开展了卓有成效的工作,希望为计算机分析汉语句子结构打下很好的基础。但实际上,这个“基础”并不能真正满足计算机进行自动句法分析的需要。因为其分类并不是在详细考察每个词的语法功能的基础上进行的,所以,目前迫切需要解决的问题是对汉语实词的句法功能进行全面系统的考察。在这个考察的过程中得到的结果,不仅可以检验以往对词的语法知识的概括是否合适,从而进行相应的调整;而且可以根据统计分析的结果为自动句法分析构建比较合理的实词词类体系,这样的知识对于没有任何隐含知识的计算机来说是进行句法分析必不可少的。只有尽可能地把每类词的句法功能描述清楚,为计算机提供更加精细和完备的词类体系,才能指导它分析出正确的句子结构,给出正确的语义解释。从发展趋势来看,越来越多的高级自然语言处理应用系统的研究与开发,诸如信息提取、机器翻译等,也都离不开这样的语法知识的支持。因此,必须加大汉语语法研究的力度,加细语法刻画的颗粒度,构建真正适合自动句法分析的汉语词类体系。 二、现有词类体系对自动句法分析的局限性 从历史上看,汉语的词类体系是以印欧语语法的词类体系为蓝本的。尽管经过几代语言学家的研究,根据汉语的实际情况作了一些局部调整,比如增加了量词、助词和语气词,从形容词中分出区别词等等,这些局部调整的确不乏闪光之处,但是基本格局没有改变,依然无法摆脱模仿的痕迹。由于始终摆脱不掉印欧语词类体系的羁绊,所以最终导致汉语词类划分并不是严格地按照词的语法功能来进行的。特别是实词分类,似乎名词、动词、形容词是生来就有的、不必加以验证的词类。尽管说语言学界对词类问题进行过几次大讨论之后逐步达成共识,认识到语法功能是词类划分的唯一标准,但在实际操作中,这一标准并没有被真正彻底地贯彻。就现有的词类体系看,“不管哪种类型,也不管是哪个版本,无一不带有先验性。它们都不是对客观存在的词进行全面分析和全面归纳的产物,而是先由语法学家所构拟然后又由语法学家加以解说的框架,这样的框架必然带有语法学家的成见和缺陷。”②具体说来有这样几个方面: 1.每个词类到底有哪些语法功能,这一点很不明确,一般的语法书上仅列出几条“语法特征”。例如,说名词可以受数量结构修饰;不能受副词修饰;可以作主语、宾语等等,但即便是这几条特征也往往缺乏普遍性。 2.属于同一词类的词,其语法功能可能有很大差异。例如,“领导”可以作主语、宾语、定语、体词性偏正结构的中心语等,而名词“期间”只具备上述功能的最后一项。 3.不同词类的词,其语法功能也许反而相似。例如,形容词“富裕”跟动词“信任”,形容词“虚假”跟名词“实物”等等。 4.一些词的语法功能没有得到充分的描写。例如,“期间”用在体词性偏正结构中,另一直接成分通常是动词或动词性结构,把“期间”看作名词或现有词类体系中的其他词类都不太合适。 5.缺乏对词的各种语法功能的定量描写。例如,一个词能作主宾语的概率是多少,作谓语的概率是多少,这种数据对于自动句法分析很有用处。③ 目前还只有对词类语法功能频率的一些小规模调查。这样粗糙的词类体系在句法分析中能起到多大作用呢?我们不妨举个例子来进行说明。例如“接待/v两/m位/q领导/n期间/n”这个短语,

文档评论(0)

镜花水月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档