基于交通领域知识网络的词汇语义相似度计算.pdf

基于交通领域知识网络的词汇语义相似度计算.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于交通领域知识网络的词汇语义相似度计算.pdf

2017年 第26卷 第 3期 http:llwww.c—S—a.org.cn 计 算 机 系 统 应 用 基于交通领域知识网络的词汇语义相似度计算① 黄 浩,陈怀新 (中国电子科技集团第十研究所,成都 610036) 摘 要:针对传统基于wordnet的词汇语义相似度计算方法中隔离抽象词汇和具象词汇,以及片面依赖上下义关 系的不足,提出了基于交通领域知识网络的词汇语义相似度计算方法.基于上下义、工具.工具对象、部件.整体 等概念关系准则构建了交通词汇的知识网络图谱,提出了修正的平均路径长度参量计算网络中词汇的语义相似 度,得到更高的语义一致性结果.实验表明,在Finkelstein的353对词汇集上,本文算法能够获得比传统方法更符 合人工判断的语义相似度. 关键词:词汇语义相似度;领域知识网络;平均路径长度;wordnet;概念关系准则 MeasuringSemanticSim ilarityofW ordsBasedonTrafficFieldKnowledgeNetwork HUANGHao,CHEN Huai—Xin (ChinaElectronicsTechnologyGroupCorporationNo.10ResearchInstitute,Chengdu610036,China) Abstract:Thetraditionalwayofcalculatingwordsemanticsimilarityisbasedonwordnetstructure,whichhasahuge gapbetweenphysicalconceptandabsrtactconcept,andonlyconsideringconcepts’hyponymy.Tosolvetheproblem,a novelwordsimilaritycalculationalgorithm basedontrafficfieldwordsrelationnewtorkisproposedinthepaper.10 kindsofconceptrelationships,includingconceptsofhyponymy,tool-toolobjectrelationship,standardparts-overalland SOon,raeusedtobuildrtafficwordsknowledgenetwork.Thenmodifiedaveragepaht lenght praameterisusedto calculatewords’semanticsimilarity,whichaccordswithpeople’Sjudgement.TheexperimentbasedonFinkelstein’S353 wordpairsshowsthatthealgorithmachievesmoreaccuratewordsemanticsimilariyt. Keywords:wordsemnaticsimilarity;fieldknowledgenewtork;averagepathlength;wordnet;conceptrelationshiprule 随着语义相似度是两个语言对象在各种语言互动 所选计算公式的影响. 类型下的语义互动强度 l【】.词汇作为 自然语言最基本 基于知识资源结构分析的相似度计算方法通过分 的单位,它们之间的语义相似度计算是一项十分重要 析专家知识库组织结构的规律,提出合理计算公式来 的基础工作,在信息检索、机器翻译、图像标签排序 量化知识库中词汇的相似关系.wordnet是其中应用最 和图像标签推荐等领域都有着广泛的应用. 为广泛的知识库,由普林斯顿的语言学家和心理学家 语义相似度的计算共有两类方法:基于分布相似 编撰,涵盖了近 117000的英文词汇.wordnet以义项为 性统计的相似度计算和基于知识资源结构分析的相似 单元,通过上下义和整体部分关系连接所有义项,构 度计算.前者基于这样一个假设:相似的词汇出现在 成了一个有层次结构的词汇网络.其中,上下义关系 相似的上下文中.统计词汇对在语料库文本窗口(通常 占比90

文档评论(0)

170****0532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8015033021000003

1亿VIP精品文档

相关文档