词语相似度计算研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
词语相似度计算研究.pdf

ITA 信息系统 ( ) ●秦春秀 , 赵捧未 , 刘怀亮 西安电子科技大学  经济管理学院 , 陕西  西安  7 1007 1 词语相似度计算研究   摘  要 : 词语相似度计算是自然语言处理 、智能检索 、文档聚类 、文档分类 、自动应答 、词义排歧和 机器翻译等很多领域的基础研究课题 。本文首先讨论了词语相似度计算的应用背景 , 然后总结了词语相似 度计算的两类策略 , 包括每类策略的思想 、依赖的工具和主要的方法 , 并对这两类策略进行了简单的 比较 。 关键词 : 词语相似度 ; 语义词典 ; 语料库 A b stract: W ord sim ilarity m ea su rem ent is a ba sic re search top ic in the field s of nature language p roce ssing, in telligen t retrieval, docum ent clu stering, docum en t cla ssification, au tom atic question an swer, word sen se disam b iguation, m ach ine tran slation, etc. Th is p ap er firstly discu sses the background of the app lication of word sim ilari ty m ea surem en t, then two strategies of word sim ilarity m easu rem ent are summ arized, including their idea s, too ls and m ain m ethod s. F inally, the two strategies are comp ared. Keyword s: word sim ilarity; sem an tic lexicon; corp u s   词语相似度计算研究的是用什么样的方法来计算或比 2 词语相似度计算方法 较两个词语的相似性 。词语相似度计算在 自然语言处理 、 智能检索 、文本聚类 、文本分类 、自动应答 、词义排歧和 国内外对词语相似度计算 的研究策略大体可分为 机器翻译等领域都有广泛的应用 , 它是一个基础研究课 两类 : 题 , 正在为越来越多的研究人员所关注 [ 14 ] 。笔者对词语 1) 根据某种世界知识 (如 Ontology) 来计算 [ 56 ] , 主 相似度计算的应用背景 、研究成果进行了归纳和总结 , 包 要是基于按照概念间结构层次关系组织的语义词典的方 括每种策略的基本思想 、依赖的工具和主要的方法等 , 以 法 , 根据在这类语言学资源中概念之间的上下位关系和同 供自然语言处理 、智能检索 、文本聚类 、文本分类 、数据 位关系来计算词语的相似度 。 挖掘 、信息提取 、自动应答 、词义排歧和机器翻译等领域 2) 利用大规模的语料库进行统计 , 这种基于统计的 的研究人员参考和应用 。 方法主要将上下文信息的概率分布作为词汇语义相似度的 参照依据 [ 78 ] 。 1 词语相似度计算的应用背景

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档