基于相关度计算的实体关系分类研究与应用-计算机科学与技术专业论文.docxVIP

基于相关度计算的实体关系分类研究与应用-计算机科学与技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 Classified Index: TP391.3 U.D.C: 681.37 Dissertation for the Master Degree in Engineering RESEARCH AND APPLICATION ON ENTITY RELATION CLASSIFICATION USING RELATEDNESS COMPUTING Candidate: Feng Jian Supervisor: Associate Prof. Liu Bingquan Academic Degree Applied for: Master of Engineering Speciality: Computer Science and Technology Affiliation: School of Computer Science and Technology Date of Defence: July, 2014 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工学硕士学位论文 哈尔滨工业大学工学硕士学位论文 摘 要 随着互联网技术的迅速发展,网络上的数据资源呈现出指数级增长的态势,信 息抽取技术就是为了从这些海量的数据资源中获取有价值的信息。信息抽取的最 终目的是从文本资源中获取到事实信息,称为实体,从更抽象的角度来看,一切 具有特定属性集合的物体都可以被视为实体。如何确定实体之间的关系已经成为 与实体相关的研究中一项极为重要的工作。 本文以计算实体之间的相关度及对实体之间的关系进行分类为目标,从实体的 属性信息入手进行实体之间相关度的计算,并将实体之间的语义相关度加入到实 体关系分类的任务中。本文相应研究以下 3 个方面的内容。 本文首先分析了传统的实体相关度计算方法,在通过实验比较了多种相关度计 算模型的效果后,本文以最常见的文本实体为例,提出了用词语和文本互相指导 的相关度计算模型。该模型旨在充分挖掘文本及其构成词语之间的关系,用词语 之间的相关度去指导文本之间的相关度,反之亦然。在此基础上,本文将互指导 计算模型应用到移动 App 实体相关度计算中,通过 App 的用户评论信息去指导 App 自身的相关度信息。 在确定了实体之间的相关度之后,本文尝试对实体之间的关系进行分类。在传 统表层语言学特征的基础上提出了语义相关度特征,并将二者融合到关系分类任 务中。在分析了主流方法中的 kNN 和 SVM 在关系分类任务中的不足后,本文提 出了用改进后的半监督自助学习算法进行关系分类。自助学习算法可以有效避免 对大量标注数据的依赖,并且在效果上接近于有监督学习方法。本文针对移动 App 实体之间关系的特点,提出在自助学习算法的初始标注集合的选取中采用分层抽 样策略,并通过控制迭代停止等参数可以达到较好的分类效果。 实体之间的相关度及实体之间的关系在推荐系统中有着广泛的应用。本文正是 将前面两部分的工作相结合,在计算出移动 App 实体之间的相关度以及对 App 实 体之间的关系进行分类的基础上,构建出一个类似于谷歌知识图谱的实体关系网 络。在该实体关系网络中,节点代表实体,节点之间的边代表实体之间的关系, 边的权重代表实体相关度的大小,本文在此网络的基础上实现了一个移动 App 推 荐系统。与已有的 App 推荐系统只给出相似推荐所不同的是,本文构建的推荐系 统不仅给出相似推荐,而且给出了相关推荐,很好地满足了用户的使用习惯。 关键词:相关度计算;互指导模型;关系分类;自助学习;推荐系统 I Abstract With the rapid development of the Internet technology, data resources on the Web are showing exponential growth trend, information extraction is to obtain valuable information from these massive data resources. The ultimate aim of information extraction is to obtain factual information from text resources, which are called entities. From a more abstract point of view, anything has a specific set of attributes can be regarded as an entity. Consequently, d

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档