词语多义的表征研究.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
词语多义的表征① 吴云芳 刘 扬 俞士汶 北京大学计算语言学研究所 北京 100871 wuyf@pku.edu.cnliuyang@pku.edu.cnyusw@pku.edu.en 摘要:词义自动消歧长时期以来一直是自然语言处理中的热点难题。词语多 义的表征主要有下面四种形式:(1)意义训释,(2)语义原语,(3)语义关系,(4)框架 网络。人和计算机都是借助词语出现的上下文语境来消解词语歧义的,而上述四 种语义表征方式都没有描述词语的上下文知识。本文主张采用复杂特征集的形式 来描述词语丰富的句法分布信息,凸显词语不同意义之间的区别性特征,更利于 计算机自动歧义消歧。 关键词:多义词,词义表征,词义消歧,复杂特征 一,引 言 如何在词典中有效地描述词语的词汇语义知识,类似于人工智能科学中对知 识表示方法的探讨,知识的表示要有利于知识的推理。在词典中对词语多义的描 述要有利于真实本文中或者言谈交际中词义歧义的消解。面向中文信息处理的词 语多义的概念和语言理论研究中的多义稍有不同(吴云芳、俞士汶,2005)。从计 算机处理文本的角度看,所谓多义词,就是同一个词形(wordform)表示了多个不 同的意义(meanings),在词典描垃中要显现词形到意义的一对多的对应关系。词 义消歧是根据词语出现的上下文语境来唯一地确定词形到意义的对应关系。 sense 本文探讨了面向语言信息处理的词义消歧(word 如何在一个机读词典中高效地描述一词多义现象。第二节简要综述了现有的词语 意义表征方式,第三节从诃义消歧的角度论述了词语多义的知识表示方法,第四 节提出了句法语义特征的表示方式,最后是结语。 ①本文研究得蓟了国家973项目(2004CB318102)的支持. 词语多义的不同表征方式 (一)意义训释 面向人的传统辞书一般都使用这种词义释义方式,即用自然语言的语句、词 语来解释一个词语的不同意义。请看《说文解字》对“月”和“口”的解释: 【月】阙也。【口】人所以言食也。 又如《现代汉语词典》(下文简称《现汉》)对“仪表”两个义项的解释: 【仪表】(1)人的外表 (2)测定温度、气压、电量、血压等的仪器 在主要面向人的辞书编纂中,如何进行义项的划分以及如何进行意义的训释,长 期以来一直是研究的热点。关于义项划分的文章如赵大明(1996),潘竞翰(2000) 等。关于意义训释的文章更为多见,例如(符淮青,1996)研究了表动作行为的词 意义、表名物的词意义、表性状的词意义,构造了词典的基本释义模式;苏宝荣 (2000)提出了语文辞书释义的原则与方法,指出释义要具有概括性、准确性和系 统性。不过我们发现,很多文章或是单独讨论义项划分,或是单独探讨释义方式, 而没有将义项划分和词义释义结合起来研究,其实这是意义训释中不可分割的两 个方面,谭景春(2000)研究结构意义对义项区分和释义的影响时比较好地结合了 两个方面。 从计算机自动词义消歧的角度看,传统的意义训释存在的问题主要是,用模 糊的、歧义的自然语言来描述定义词语意义,人利用丰富的世界知识或许可以把 握词义,但计算机处理起来却困难重重(关于这一点后文还有详细的论述),有时 甚至有可能引发歧义的膨胀。例如《现汉》对动词“把握”区分了两个义项,其中一 个义项的解释为“握;拿”,“握”又区分成了2个不同的义项,“拿”又区分成了7 个不同的义项,如果不加入更多的知识,计算机依次进行推理就会得出“把握”有9 个不同的意义。 (二)语义原语 语义原语(semantic 理解的、不可再分的简单意义,用这些简单意义来描述复杂的意义,这些简单意 义就称之为语义原语。例如对于英语单词bachelor的描述。 hasnever bachelor:(human)(male)(whomarried) 又例如对于英语单词lie的描述: XliedtoY— Xsaid to Y person something Xknewitwasnottrue XsaiditbecauseXwantedYtothinkitwastrue

文档评论(0)

开心农场 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档