知识图谱中实体相似度计算研究AResearchonEntities-计算语言学.PDFVIP

知识图谱中实体相似度计算研究AResearchonEntities-计算语言学.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识图谱中实体相似度计算研究AResearchonEntities-计算语言学.PDF

文章编号: 知识图谱中实体相似度计算研究 李阳1 (1.华东理工大学计算机科学与工程系,上海,200237 ) 摘要:实体相似度的计算有诸多应用,例如电商平台的相似商品推荐,医疗疗效分析中的相似病人组等。 在知识图谱的实体相似度计算中,给出了每个实体的属性值,并对部分实体进行相似度的标注,要求能得 到其他实体之间的相似度。本文把该问题归结为监督学习问题,提出一种通用的实体相似度计算方法,通 过清洗噪声数据,对数值、列表以及常文本等不同数据类型进行预处理,使用SVM, Logistic 回归等分类 模型、Random Forest 等集成学习模型以及排序学习模型进行建模,得到了较好的结果。 关键词:实体相似度;监督学习;分类模型;集成学习 中图分类号:TP391 文献标识码:A A Research on Entities Similarity Calculation in Knowledge Graph Li Yang1 (1. Department of Computer Science and Engineering, East China University of Science and Technology, Shanghai 200237, China) Abstract : Entities similarity is useful in many areas, such as recommending similar merchandises in E-commerce platforms, analyzing similar patients in healthcare, etc. During the calculation of entity similarity in knowledge graph, the attributes of every entity and portion of entity pairs’similarity are given. We are supposed to calculate similarity of other entity pairs. This article defines this task as a supervised learning problem. We propose a general method to calculate entity similarity, firstly preprocess the data and then use classification model, including SVM, Logistic Regression, and integrated learning model, such as Random Forest, and Learning to rank model. After comparing the different methods, the best result is achieved. Key words: Entity Similarity; Supervised Learning; Classification Model; Ensemble Learning 1 引言 知识图谱(knowledge graph )是时下非常热门的研究领域。它本质上是一种语义网络, 其结点代表实体(entity )或者概念(concept ),边代表实体/概念之间的各种语义关系。对 于一个包含众多实体的知识库,我们除了关注实体本身的信息外,还需要关注实体与实体 之间的关联信息。其中面临的一个问题就是:给定两个实体,如何判断它们之间是否相似, 以及相似的程度有多高。 实体间的相似是指实体之间在深层语义上的相似,而非只关注表层信息的传统相似度。 例如 “刘德华”和 “张学友”都是香港歌手,他们之间有很多共同的属性;相对的,“刘德 华”和 “马德华”虽然在名字上很相似,但他们之间却没有太多的属性共性,所以 “张学 友”比

文档评论(0)

shiyouguizi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档