浅谈一种基于过程本体语义检索方法.docVIP

浅谈一种基于过程本体语义检索方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈一种基于过程本体语义检索方法

浅谈一种基于过程本体语义检索方法   摘要:本文首先提出了在知识检索领域中的如何能够高效快速地获取到知识的问题,随后分析了现有检索技术,主要是关键字检索和框架语义检索的优缺点,进而提出了一个基于过程本体库的语义检索算法,并分别论述了此种语义检索算法中的定义过程本体、索引本体、定义检索词和内容匹配四个步骤,最后指出了基于过程本体的语义检索的优点和缺点。   关键词:过程本体 语义网 语义检索 过程本体库   中图分类号:TP31 文献标识码:A 文章编号:1007-9416(2014)09-0047-01   1 问题的提出   知识管理在中国越来越受到各大企业的重视,知识汇集和知识共享包括知识的检索成为知识管理的核心。知识检索的维度也从静态的文本知识的检索扩大到了对动态内容的知识挖掘。这些动态内容包括一些应用软件,譬如:工程管理软件、金融软件、会议计划软件以及文字处理软件;同时也包含一些软件组件、过程模型以及个人或组织的搜索热点等。如何能够快速和准确地从这些动态内容中获取有效知识也成为亟待解决的问题。本文主要提出了一种基于过程本体,在语义网中提高检索质量的方法。   2 现有检索技术的优缺点   现有检索的方法虽然也能够挖掘出一些知识,基本能够满足检索内容的需求,但是却有极大的局限性。内容检索技术源于几个社区网站,这些社区网站更加关注于文本检索而不是内容本身,因此它们更加强调的是关键字检索。软件代理中心和一些社区网站又开发出一种基于框架对任务和在线服务进行匹配的检索方法即:框架检索。   现在中国市场上流行的搜索引擎大多是关键字检索,而在检索结果页面中提示常用搜索词的使用大大提高了检索精度。然而,关键词检索相对来说精度低、语义贴合度低,一个关键词检索可能把很多完全不相关的内容检索出来导致检索精度低;同时会发生检索结果种存在和检索词语义相同但是语法完全不同的情况而导致语法贴合度低。同时关键词检索也会出现检索结果不全面的情况,譬如在关键词搜索引擎中输入“贷款房子”,搜索引擎可能仅仅把贷款买房子的相关文档搜索出来,但是贷款房子相关的环节如贷款计算器、评估抵押机构等都不会出现在检索结果中。   为了解决上述问题,一种方式就是构建语义网来获取一个词的上位词、下位词、近义词、同义词、反义词,以此来增加关键词检索结果的全面性和适用性,但是这种方式是以牺牲检索结果的精度为代价的,因为语义网只是单纯的关注语言之间的关系。为了使语义网能够更加准确地表达词条,框架检索应运而生。   框架检索中的框架是由描述词条属性的属性组成。词条和检索词都是以框架方式进行描述的,检索时即将词条和检索词的框架属性进行匹配即可。更多的成熟检索工具使用框架检索来取代语义网的使用,但是框架检索需要所有的内容都要事先进行框架化,这是一项非常繁重的工作。   3 我们提出的解决方案:使用过程本体   使用本体可以有效地描述对象(概念)及对象间的关系,并进行分类、注册和查询操作。但传统的本体以静态实体为基础,并不适合处理一般的动态现象(活动),这时就需要使用过程本体。过程本体中的基本实体(概念)是抽象或具体的过程、活动、事件及与之相关的参与者、条件等概念,它们之间有着不同类型的关系。   现在我们面临的挑战是在不降低语法贴合度和不能提高构建语义网的难度的前提下,保证用户检索到尽量多并准确的内容。我们解决方案的核心是使用过程本体库来达到上述目的。首先,我们需要一个将本体进行过程模型的函数,这个函数将将本体和它所属的内容(包括它的下位词等)索引到本体库中的恰当位置,方便后续检索。检索词可以被完全或者部分表达为过程模型,在匹配算法中,过程本体库中的语义关系和检索词的过程模型进行匹配,最终检索到所有最匹配的本体。图1是我们解决方案的算法结构图。   下面我们将就此算法中的每个节点逐一介绍。   3.1 定义过程本体   我们的解决方案不同于关键词检索或者框架检索,我们更加关注于把富有表述性的过程模型转化为过程本体。解决的关键是创建一个过程本体库,它是一个由科学家、专家、老师、学生等各个行业人员长时间的共同努力构建的一个过程知识库。一个过程本体是由以下几部分的过程知识组成:属性、接口、子过程、关系、异过程、定义六部分。其中,属性是过程本体的文本描述,过程的持续时间以及过程存在的背景等;接口用来描述一个过程节点的输入、输出的行为,描述过程节点使用的资源类型,它对于检索词和本体定义之间的匹配非常重要;子过程是过程的分解;关系用来描述过程本体中的各个节点之间的相互依赖关系;异过程用来描述过程本体中不属于此本体的节点,以此来提高检索的精度;定义是上述五个要素的集合。   3.2 索引本体   把本体索引到过程本体库中方便用户使用过程本体库进行检索。索引

您可能关注的文档

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档