面向中文信息处理的现代汉语-n%2bn-结构歧义问题的研究.pdfVIP

面向中文信息处理的现代汉语-n%2bn-结构歧义问题的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向中文信息处理的现代汉语“n+n 结构歧义问题研究 杨泉冯志伟 北京广播学院,北京100024, yq7755@Sim.∞m 国家语委语言文字应用研究所,北京100010, 册蜊e@public.bta.net.∞ 摘要 本文在潜在歧义理论的基础上,重点分析其中两个名词的语法、语义、语用 特性,对汉语中的“n+n”结构做了比较全面的研究。本文的目的在于找到这种结 构产生歧义的原因和消解歧义的策略。 本文的研究结果可以应用于真实文本中汉语潜在歧义结构的计算机自动消 歧。更重要的是,“n+n”潜在歧义结构的研究可以促进中文信息处理中包含名词 的短语歧义结构研究,也为研究现代汉语中的歧义问题提供了一个新的视角。 关键词格式真歧义短语;实例真歧义短语语;语义特性 1 引言 歧义问题是语言学中的一个难点,也一直是自然语言理解和机器翻译中难以解决的问 题。1960年巴尔一希列尔(B心HiUel)就曾说过歧义是自然语言处理过程中的主要绊脚石。 事实上,虽然歧义在自然语言中普遍存在,真正影响到人们交流的情况却很少。这可能 是因为在交际过程中,人们总是可以根据一定的知识背景,文化常识、结合特定的上下文和 某些语法、语义特点找出几个意义当中正确的一个。人类这种“与生俱来”的本领恰恰是机 器欠缺的,可是如果我们能将人类排除歧义的主要依据找到,通过一定的算法教会计算机, 似乎就可以帮助计算机解决自然语言处理过程中的歧义问题。 本文作者从这种思想出发,以“n+n”这种具有潜在歧义的结构为切人点,重点分析其 中两个名词的语法、语义关系,希望能为自然语言计算机处理中的歧义消解提供一定的参考 作用。 2研究概况 人们对歧义现象的关注早在两千三百年前就开始了,古希腊哲学家亚里士多德(A五s. tOteleS)在他的《工具论·辨谬篇》中,探讨了自然语言的歧义问题,但亚里士多德对歧义的研 ·508·其 他 0f 型》(SevenTypes Ambiguity)一书,正式开始从语言理论的角度研究歧义问题。而在人们 对自然语言进行信息处理后,更关注的是如何让计算机自动消歧。1963年,K矗tzt和蹦or 首先提出利用语义选择限制的方法①去消解歧义,从此,利用语义特征不同形式的各种研究 方法几乎被用在每个计算模型的消歧上。1975年威尔克斯(wilks)最先成为优选语义学的 运用选择限制和语义近似度相结合的办法处理多义词消歧问题u,2J。1983年Dyer发明 BORIS系统,这个系统利用自顶向下预测与选择限制相结合的方法去理解复杂文本,取得 了很好的效果。1986年QuiⅡiaJl引进自然语言的语义网络来表达词义以及词与词之间的概 义网络研究的一个主要成果,对自然语言计算过程中的歧义问题研究很有价值。 我国对汉语歧义研究主要集中在歧义分类、歧义成因、歧义格式、歧义界定、歧义分化、 消歧手段、歧义指数、意义优选和歧义度。语言学界研究歧义主要是为了找出人与人在交际 过程中产生歧义的原因及全部类型。而计算语言学家的任务则是在语言学家研究成果的基 础上,考察机器在处理自然语言的过程中所遇到的歧义,包括多义词义项选择,歧义字段切 分,歧义格式分化等。目的是为了找到消解歧义的策略。 3理论基础 歧义格式的概念,赵元任先生早在文献[3]中就涉及过,他说“是……的”是一个非常普 通的产生直接成分歧义的格式[1|。朱德熙先生在文献[4]中从理论上概括了语言中歧义格 式的类型,明确提出“歧义格式”这个概念。他认为,句子的歧义“是代表了这些句子的抽象 的‘句式’所固有的”,因此,他主张用“歧义格式”来概括语言中的同形歧义格式。 冯志伟先生在研究汉语术语歧义问题时,提出“潜在歧义理论”(PotentionalAmbiguity, 简称PA论)[5|,PA论认为,中文词组型科技术语中,当一个盯结构(词组类型结构)对应 于一个以上的SF结构(句法功能结构)时,就有可能对这个PT结构做出一种以上不同的解 释,这时,就说这个门结构是潜在歧义结构,之所以说是“潜在歧义”,是因为在门结构实 除,成为歧义消解结构,因

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档