基于语义关联的实例相似度计算方法及应用研究.docVIP

基于语义关联的实例相似度计算方法及应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义关联的实例相似度计算方法及应用研究

基于语义关联的实例相似度计算方法及应用研究   〔摘要〕相似度计算方法的优劣直接影响到信息检索与推荐的效果。本文根据本体图模型中属性序列的特点,综合考虑层次关系和属性关系,在分析路径关联相似度、层次相交关联相似度及属性相交关联相似度的影响因素的基础上给出了实例之间综合语义相似度的计算方法。文章最后讨论了该相似度计算方法在解决基于内容的推荐中的过于专门化问题、协同过滤推荐中的稀疏性问题以及检索中查全率和查准率问题中的应用 〔关键词〕语义关联;相似度计算;本体;属性序列 DOI:10.3969/j.issn.1008-0821.2015.08.030 〔中图分类号〕G2522〔文献标识码〕A〔文章编号〕1008-0821(2015)08-0151-06 相似度计算是知识检索和知识推荐的基础及关键技术,其计算方法与资源和用户的建模及表示方式有关。本体建模由于其良好的概念层次结构、对逻辑推理的支持以及对知识的共享和复用,已成为主流的方法 当前基于本体的相似度计算存在两大问题: (1)为简化本体构建和相似度计算,较多考虑本体中的层次关系,忽略属性关系,影响了相似度计算的准确性。文献计算相似度只考虑层次关系,忽略了属性关系,丢失了很多语义描述。文献[2-4]引入属性关系计算综合语义相似度,但考虑的属性关系过于简单,不具有普适性 (2)侧重概念相似度计算的研究,较少有实例相似度计算的研究。计算概念相似度的目的在于可以将信息资源(如文本、网页等)特征表示为概念的集合,然后借助概念相似度计算信息资源的相似度。但在实例作为信息资源特征表示对象的应用中,需要计算实例相似度。文献[5]分析了实例相似度的影响因素,但受应用的限制,对实例相似度影响因素的分析不够全面 本文分析了实例之间的层次关系和属性关系对相似度计算的影响,讨论了实例之间基于语义关联的相似度计算方法,并介绍了该计算方法在信息推荐和信息检索中的应用,期望改善内容推荐中的专门化问题、协同过滤推荐中的稀疏性问题以及检索中查全率和查准率不高的问题 1研究背景 11本体模型的构建 本体是共享概念模型的明确的形式化规范说明[6],可以理解和表达为一组概念的定义及其相互关系。可以将本体形式化表示为:O={C,I,RH,RP,A},其中C指概念,也称为类;I指实例,即类的具体实体;RH指概念或实例之间的层次关系(Hierarchy Relationship),包括概念之间的SubclassOf关系和概念与实例之间的InstanceOf关系;RP指概念之间或实例之间的属性关系(Property Relationship),是由用户自定义的对象属性,加强了人类的认知;A指公理 本体模型构建一般考虑的是层次关系,表现为本体的树形结构。如若同时考虑层次关系和属性关系,则表现为更为复杂的图形结构。为简单说明,使用斯坦福大学开发的protégé43构建Movie本体。protégé43中的OntoGraf插件可以将Movie本体中的类、实例及关系以图形的形式更清楚地呈现出来。在OntoGraf中,本体表示为由节点和边组成的有向图,节点表示概念或实例,边表示属性。仅考虑层次属性RH时,本体表现为树形结构(图1),综合考虑层次属性RH和对象属性RP时,本体表现为图形结构(图2)。图1仅考虑层次属性的Movie本体 2属性序列 文献[7]首次提出属性序列的概念,但在属性序列的定义中仅考虑属性关系RP。本文根据实例相似度计算的需要,综合考虑层次属性RH和对象属性RP,重新对属性序列进行定义 定义1在有向本体图模型中,如果存在n个属性p1,p2,……,pn将n+1个节点a1,a2,……,an+1连接起来(如图3所示),其中pi(1≤i≤n)∈RH∪RP,ai(1≤i≤n+1)∈C∪I,则称该有限属性集合为属性序列(Property Sequences,PS),形式化表示为:ps={p1,p2,……,pn}。属性序列的长度(length)即ps中属性的个数 定义2函数NodesOfPS()返回属性序列中属性所连接的所有节点,即NodesOfPS(ps)={a1,a2,……,an+1}。节点a1称为属性序列的起点(origin),节点an+1称为属性序列的终点(terminus) 定义3如果属性序列ps1和ps2满足NodesOfPS(ps1)∩NodesOfPS(ps2)≠,则称两个属性序列相交(Joined Property Sequence),ai∈(NodesOfPS(ps1)∩NodesOfPS(ps2))称为相交节点(join node) 13语义关联 本体图模型中,如果两个实例间存在连通路径,则称两个实例存在语义关联(Se

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档