基于顶级本体语义表达的领域本体构建实证研究.docVIP

基于顶级本体语义表达的领域本体构建实证研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于顶级本体语义表达的领域本体构建实证研究   〔摘要〕以清晰表达知识内涵、促进信息资源语义共享为目的,以卫生监督调查信息为研究案例,尝试利用顶级本体属性元素构建具有通用语义特征的领域本体。通过领域知识本体的构建实证,详尽阐述依托“七步法”构筑领域本体的方法,探讨使用领域术语构建本体知识表达的途径,实现了卫生监督调查信息知识的本体化,为该领域知识的信息资源语义整合提供研究基础。   〔关键词〕领域本体;卫生监督调查;本体构建   在大数据背景下的现代信息社会,信息孤岛严重影响了知识的获取效率,领域信息的语义共享在数据海量增长的今天已经变得迫在眉睫,而领域信息资源实现语义整合的主要保障是以本体为基础的知识组织。   由于领域本体在构建过程中缺乏统一的语义约束,大量的领域本体受限于不同的应用情况,出现不同程度的语义异构,影响领域本体间的联合应用,而这种领域知识的语义整合需求在大数据背景下几乎不可避免,因此,构建具有统一语义表达方式的领域本体可以做为解决语义异构、实现领域知识语义整合的一种新途径。   本研究以卫生监督调查信息为研究案例,以“全国卫生监督调查制度”为研究框架,利用顶级本体的通用属性尝试构建具有统一表达方式的领域知识本体,初步完成了领域信息资源语义整合的初级阶段工作,探讨领域信息资源语义整合的基础性问题,旨在探索促进信息共享和知识发现的有效途径。   1基本理论依据   领域本体主要应用于知识密集领域的信息表达,以提高数据信息的利用效率。在信息技术层面,本体可以用于信息抽取、信息检索以及信息系统互操作等方面[1]:在信息抽取技术上,一般通过本体来指导识别抽取实体及实体间的关系,从而提高抽取性能;在信息检索技术上,可以凭借本体良好的概念层次,通过各类逻辑推理等技术进行基于语义的信息检索[2];信息系统的互操作则通过本体明确规范的概念模型,保证信息系统协调的一致性,进而解决信息异构问题。   顶级本体(Upper-level Ontology)也被称为上层本体或顶层本体,是描述概念之间最普遍联系的知识体系。作为领域本体的参考依据,它揭示了领域知识在更高语义层次上的关系。从顶级本体的研究视角来看,比较知名的顶级本体如SUMO[3]、Cyc本体[4]等,都为用户提供了规模庞大的一般性知识框架,SUMO不涉及具体的领域知识,Cyc本体则包含大量的实例信息。目前这些项目的应用中较多涉及推理及查询,对于本体整合方面的应用研究较为鲜见[5]。目前,从结构化数据中归纳、构建本体的研究已经较为广泛[6],从非结构化数据中构建本体则仍面临较多挑战。   利用顶级本体的属性规则构建领域本体,可望从根本上解决不同领域本体之间的语义异构,从而促进领域本体互联互通。本例中选用的UMLS Semantic Network顶级本体,是一体化医学语言系统(UMLS,Unified Medical Language System)的主要组成部分之一。做为一种顶级本体,它通过建立一种基于语义类型和语义关系共同作用的规则,对UMLS系统中的海量超级叙词进行标引,以实现各个词表中的词汇互通,达到术语转换的目的。该本体的语义表达方式主要体现为其本身的语义属性,顶级本体的语义属性具有通用性特点,在W3C推荐的网络本体语言OWL中,属性主要包括对象属性和数据属性,与领域本体有所不同的是,作为表达通用知识的语义网络并不含有具体实例,也不表达属性的具体值,其所表达的类(即语义类型)之间的关系仅用对象属性就能进行解释,因此这里的属性集主要由对象属性构成,包括五大类48子类共54条,五大类分别是物理相关(physicallyrelatedto)、空间相关(spatiallyrelatedto)、功能相关(functionallyrelatedto)、时间相关(temporallyrelatedto)和概念相关(conceptuallyrelatedto)。   21领域知识来源   根据经典的七步法[7],领域本体的建立首先要明确专业领域和知识范畴,并考虑复用已知本体,已达到本体资源优化的目的。以本研究涉及的卫生监督调查信息为例,其知识主要源自《全国卫生监督调查制度》[8]所包含的21种专业调查信息卡。该调查采取信息报告的方式,通过计算机网络以及相关系统,建立高效的卫生监督信息体系,真实、准确、及时地收集汇总卫生监督工作信息。   其信息内容主要应用于3个方面。包括用于评价考核各级卫生行政部门和卫生监督机构的卫生监督业务工作情况,以及食品安全企业标准备案情况;各级卫生行政部门科学合理制定卫生监督工作计划和规划,按规定适时向社会和有关部门通报、反馈卫生监督统计分析信息;为各级政府制定公共卫生政策提供科学依据。   22领域知识分析   该调查信息以信

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档