基于词形模糊归并的英文同义关系发现研究.pdfVIP

基于词形模糊归并的英文同义关系发现研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NSTL知识组织专刊 http: // 基于词形模糊归并的英文同义关系发现研究* □ 宋培彦 袁旭 / 中国科学技术信息研究所 北京 100038 摘要:同义关系是构建知识组织系统的重要方面。从词汇语义学角度对术语同义关系类型加以界定,采用 词形还原工具Norm 获得英文术语原形,获得同义词侯选集,进而基于词形模糊归并模型确定同义关系。实验 结果表明,基于词形的模糊归并有助于提高术语同义关系的构建效率。 关键词:词形还原,术语,同义词,模糊归并 DOI :10.3772/j .issn .1673—2286.2012.12.010 1 引言 同义词是意义相同或意义相似的词。语言学家John I. Saeed的定义是:“同义词是那些意义相同或非常相似, 同义关系是叙词表、语义网络、本体等知识组织工 但发音不同的词。”《韦氏同义词新词典》给同义词的界 具最重要的构成要素之一,在信息检索、信息标引、术 定是:“本词典中,同义词将始终指的是英语中基本意义 语服务等许多研究领域有着广泛的应用。面对海量的 相同或非常相近的两个或多个词之一。”认知语言学家 术语和数字化文献资源,如何有效地对英文术语同义 J.Lyons认为在同义词与近义词之间还有一类词,这类 关系准确、快速地进行识别和归并,进而提高构建知识 词与另外两类词既有联系又有区别,即把同义词分为三 [1] 组织系统的效率,是当前需要加强研究的课题。 类:绝对同义词、部分同义词、近义词 。可见,同义词是 同义关系本质上是对同一概念的指称。同一个概 一种语义边界较为模糊的词语类聚方法,判断标准带有 念可以通过词或词组进行符号化,形成一组意义相同 一定的主观性,常常随着人们对客观事物认识角度、词语 或相近的集合。从词汇学的角度来说,术语作为一种约 使用语境等因素不同,这对计算机进行自动判定带来了 定俗成的语言符号系统,具有“能指”和“所指”两个 很大难度,需要人机结合进行判定。 方面,人们可以通过特定的符号形式对概念进行指称 人们对同义关系的实证研究也取得了很大进 和交流。语言符号和概念之间存在着某种重要的对应 展。总体上分为三种方法,一是基于wordnet等语义 关系,这就为计算机通过术语的形态变化自动进行同 资源,对词语之间的同义关系进行计算,如Andrew 义关系发现提供了重要依据。英文术语存在着较为丰 Krizhanovsky提出的基于同义词库提供源数据的语义 [2] 富的语言形态变化,通过词形处理获得术语原形并进 距离计算方法 ,这种方法准确率相对较高,但需要事先 行归并,有助于发现术语之间隐含的同义关系,为知识 建立一个语义关系准确、规模适当的术语资源,资源要求 组织系统的构建提供必要的支持。 较高;二是采用模式匹配方法,制定同义关系的发现规 则,从语料库中根据相似度挖掘出同义词,这种方法具有 2 研究现状

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档