基于知网的词语语义相似度算法.pdfVIP

  • 10
  • 0
  • 约1.75万字
  • 约 5页
  • 2018-08-19 发布于天津
  • 举报
基于知网的词语语义相似度算法

第 卷 第 期 计 算 机 工 程 年 月 人工智能及识别技术 文章编号 文献标识码 中图分类号 基于 知网 的词语语义相似度算法 王小林王 东杨思春邰伟鹏郑 啸 安徽工业大学计算机科学与技术学院安徽 马鞍山 摘 要 词语语义相似度计算在信息检索文本聚类语义消歧等方面有着广泛的应用 基于 知网 提出一种词 语语义相似度算法 设计一种义原分类将义原分为第一基本义原其他基本义原和间接义原 类 与以往义项 相似度计算方法不同根据不同类义原对义项相似度影响的大小分别使用不同的义原相似度计算方法进行义项 相似度的计算 利用词语之间第一基本义原相似度最高的义项组合进行词语语义相似度计算剔除相似度较低的 组合对词语语义相似度结果的影响 实验结果表明该算法能有效提高运算效率和精确度 关键词 义原义项词语语义相似度知识描述语言 中文引用格式 王小林王东杨思春等基于知网 的词语语义相似度算法计算机工程 英文引用格式 之间的相似度 概述 目前我国很多学者都采用基于世界知识体系 词语语义相似度计算在自然语言处理的诸多领 的方法均以 知网 作为研究语义计算的首选工 域有着非常广泛的应用例如在信息检索文本分 具并取得一定的成果 知网 是一个以汉语和英 类机器翻译词义消歧等 目前词语语义相似度的 语词语所代表概念作为描述对象 以揭示概念与概 计算方法主要有 种一种是基于统计的方法利用 念之间以及概念所具有的属性之间的关系作为基本 大规模语料库来统计词语之间的相关性通过它得 内容的常识知识库 在传统词汇学中把义项作为最 出词语之间的相似度另一种是基于某种世界知识 小的意义单位就是通常所说的一个词的意义 一 或者分类体系的方法主要是根据一部语义词典对 个词语可以有一个或者多个义项 义原是描述一个 词语及其层次关系的解释结合相关公式计算词语 义项的最小意义单位是 知网 中最小的语义单位 基金项目国家自然科学基金资助项目 安徽省高校省级自然科学基金资助项目 作者简介王小林 男教授主研方向人工智能中文信息处理王 东硕士研究生杨思春副教授博士邰伟鹏讲师博 士研究生郑 啸教授博士 收稿日期 修回日期

文档评论(0)

1亿VIP精品文档

相关文档