词典多义词义项关系及词义区分.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010年1月 云南师范大学学报 Jan.,2010 第42卷第1期 (哲学社会科学版) V01.42No.1 【主持人语】本期的“语言国情研究”栏目关注汉语的语言信息处理研究,特别是词汇语 义的计算机处理。在自然语言中,一词多义是非常普遍的现象,因此要实现对文本内容的理解 和自动处理,必须面对如何识别多义词的不同词义这个问题。词义消歧研究就是为解决这个 问题而产生的,并随着研究的发展,逐渐成为自然语言处理的基础性工作,是许多基于内容理 解的自然语言处理任务的必要环节。在词义消歧研究中,词义知识来源、消歧线索、消歧方法 是需要特别关注的问题。词典是词义消歧最常用最基本的知识来源,但由于传统词典是面向 人的使用而设计的,用于计算机处理时,有诸多问题需要解决,例如义项分立规则的不明确、义 项之间的区分线索不清晰等。在消歧线索方面,词类、搭配、释义文本都是常用的信息,其中词 类的作用举足轻重,有助于大幅降低歧义消解的复杂度。在具体的消歧方法上,偏向计算机或 语言学的研究者侧重点有所不同,侧重语言学依据的研究者强调通过分析多义词的性质寻找 更有针对性的消歧方法。本期的三篇论文分别聚焦于这几个点,依次讨论了多义词义项划分、 使用词类区分词义和多义动词的消歧策略,希望这些讨论有助于吸引更多学者关注汉语语言 信息处理研究,推动汉语的信息化进程。(本期栏目学科主持人简介:靳光瑾(1952一),女,博 士,教育部语言文字应用研究所研究员,教育部语言文字应用研究所副所长,国家语委语言文 字规范标准测查认证中心主任,中国辞书学会副会长。主要研究方向为计算机语言学) 词典多义词义项关系与词义区分+ 肖 航 (教育部语言文字应用研究所,北京100010) [摘要]从为语料库标注多义词词义的实践来看,词典普遍存在词义可区分性不足的情况。根 据对《现代汉语词典》的分析,本文认为词典中多义词的义项之间存在重叠、相离、包含等关系,这些关系 对词义的准确区分带来不利影响,具体表现为词义区分线索不足、义项缺失等形式,降低了词义区分的 准确率和可操作性。本文结合词义标注语料数据对这些表现分别进行了分析,指出厚清多义词义项之 间的关系、改善词义可区分性能够提高词义消歧的准确率,同时有助于提高词典编纂的质量。 [关键词]义项划分;词义区分;词义标注;多义词;语料库 [中图分类号]Ho—05[文献标识码]A 一、引 言 义消歧研究的核心问题。词义标注研究在词义体 通过对语料库标注多义词词义是检验词典义 系的选择上存在采用传统语文词典、语义词典等 项划分合理性和完备性的主要方式之一;03同时, 不同的方式。以词典作为词义体系,词义标注必 建设大规模词义标注语料库也是自然语言处理研 须面对词典义项划分中的问题。从现有的研究来 究的一个重要任务。[2]一般而言,语料库词义标注 看,词义标注主要存在两大难点,都与词典的义项 是指给语料中的多义词标注正确的词义,为语料 划分情况有关。第一个难点是词典的义项划分是 库添加词汇语义标记的过程。词义标注语料库在 否具有足够的清晰度,具有足够多的区分线索。 词典编纂、语言处理研究中起着基础性资源的 根据词典标注词义,势必要了解词典的释义过程, 作用。 特别是释义的规则和义项分立的原则,而从目前 词义的可区分性及区分方式是词义标注和词 词典释义本身来看,很多多义词的词义之间区分 ·[收稿El期]2009—12—28 [作者简介]肖航(1974一),男,福建尤溪人,教育部语言文字应用研究所助理研究员,新加坡国立大学研究生毕 业,研究方向为计算语言学。 万方数据 ·42·

文档评论(0)

kehan123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档