- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于交通领域知识网络的词汇语义相似度计算① - 计算机系统应用
2017 年 第 26 卷 第 3 期 计 算 机 系 统 应 用
基于交通领域知识网络的词汇语义相似度计算①
黄 浩, 陈怀新
( 中国电子科技集团第十研究所, 成都 610036)
摘 要: 针对传统基于 wordnet 的词汇语义相似度计算方法中隔离抽象词汇和具象词汇, 以及片面依赖上下义关
系的不足, 提出了基于交通领域知识网络的词汇语义相似度计算方法. 基于上下义、工具-工具对象、部件-整体
等概念关系准则构建了交通词汇的知识网络图谱, 提出了修正的平均路径长度参量计算网络中词汇的语义相似
度, 得到更高的语义一致性结果. 实验表明, 在Finkelstein 的353 对词汇集上, 本文算法能够获得比传统方法更符
合人工判断的语义相似度.
关键词: 词汇语义相似度; 领域知识网络; 平均路径长度; wordnet; 概念关系准则
Measuring Semantic Similarity of Words Based on Traffic Field Knowledge Network
HUANG Hao, CHEN Huai-Xin
(China Electronics Technology Group Corporation No.10 Research Institute, Chengdu 610036, China)
Abstract: The traditional way of calculating word semantic similarity is based on wordnet structure, which has a huge
gap between physical concept and abstract concept, and only considering concepts’ hyponymy. To solve the problem, a
novel word similarity calculation algorithm based on traffic field words relation network is proposed in the paper. 10
kinds of concept relationships, including concepts of hyponymy, tool-tool object relationship, standard parts-overall and
so on, are used to build traffic words knowledge network. Then modified average path length parameter is used to
calculate words’ semantic similarity, which accords with people’s judgement. The experiment based on Finkelstein’s 353
word pairs shows that the algorithm achieves more accurate word semantic similarity.
Key words: word semantic similarity; field knowledge network; average path length; wordnet; concept relationship rule
随着语义相似度是两个语言对象在各种语言互动 所选计算公式的影响.
类型下的语义互动强度[1]. 词汇作为自然语言最基本 基于知识资源结构分析的相似度计算方法通过分
的单位, 它们之间的语义相似度计算是一项十分重要 析专家知识库组织结构的规律, 提出合理计算公式来
的基础工作, 在信息检索、机器翻译、图像标签排序 量化知识库中词汇的相似关系. wordnet 是其中应用最
和图像标签推荐等领域都有着广泛的应用.
文档评论(0)