知识图谱人物本体模型设计方法.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识图谱人物本体模型设计方法   摘要:人物本体在众多领域知识图谱中具有重要的作用,但目前人物本体设计较为简单,难以通用。本文通过人物相关案例构建小型的本体模型,分析其中存在的多元关系问题,结合多元关系的定义介绍多元关系的表示方法。对于在多元关系设计中存在不同设计方案,提出通过将本体模型部分映射为关系数据库,利用关系数据库N泛式原则优化多元关系设计。利用现有的本体模型基础上设计领域本体模型,在兼顾领域问题的同时保证扩展性和通用性,并基于Wikidata中的Human类设计,给出了本文中的人物本体泛式,专门针对地理位置和时间本体进行了优化设计。   关键词:本体模型;多元關系;领域图谱;知识图谱   0引言   知识是数据中有规律的信息和信息上下文的集合,知识的上下文表示信息之间的关系,知识具有经验性。为了让计算机可以存储和计算知识,上世纪五十年代学者提出的一种可以在计算机硬件中的存储和表示知识形式一语义网络(Semantic Network)。   语义网使用w3C制定的资源描述框架RDF(Resource Description Framework)作为知识表示的数据模型,在RDF中知识使用SPO二元组(Subject,Predicate,Object)的形式存储。目前比较知名的开放RDF知识数据库有DBpedia、Freebase等。RDF在发布之初定义了常用的Predlcate关系,通过固定的IRI表示,统一的IRI定义可以实现不同知识之间的共享。但RDF定义中可以表示的知识有限:RDF预定义的Predicate关系中没有区分概念和实体,也无法定义概念的属性和概念之间的关系,RDF仅能表示Subject和Object之间的关系,没有泛化和抽象的表达能力。为了提高知识表达范围,在RDF的基础上提出了RDFS(Resource DescriptionFramework Schema),在知识数据存储之前需要定义知识的概念和关系等,对知识概念和关系的定义成为本体模型(Ontology Model)。随后在RDFS的基础上,根据定义中的实际需求扩展了OwL(webOntologyLanguage)本体语法以及随后的OWL2,其中OwL相比于RDFS增加了数值属性和对象属性的不同定义。弥补了RDFS的定义中无法区分实体的属性以及实体之间的关系问题。OWL2在OWL基础上增加了角色链。双关等特性定义,规范了表达技巧。目前OWL2已经成为本体建模的推荐标准,国际万维网组织WWW(world Wildweb)负责本体描述语言的标准制定。   1 相关研究介绍   主流知识图谱大致可以分为通用知识图谱UKG和领域知识图谱DKG。UKG是面向全领域信息构建知识表示和关联关系,强调的是广度,而DKG是面向特定的垂直领域构建知识关系,对于数据有更严格的前置数据模式和准确度要求,强调的是深度。DKG在金融量化交易、学者信息搜索智能教育、历史研究、生物医学等垂直领域有广泛的应用。构建UKG和DKG时,两者之间的主要区别在于UKG一般使用“自底向上”的方法构建知识库,而DKG使用“自顶向下”的方法。UKG的“自底向上”方法体现在利用开放式关系抽取(Open Information Extraction,OIE),通过语法结构分析文本中的实体和关系构建二元组,构建DKG的“自顶向下”方法需要在设计之初首先确定待解决的领域问题,通过本体建模的方法明确问题的范围、包含的实体以及实体的属性和关系,并且根据领域内的规律构建推理规则。DKG与UKG之间相辅相成,DKG可以从UKG中获取通用性的知识。而DKG本身就是UKG在具体领域的丰富和延展。为了通用性,DKG在设计时需要考虑与UKG的兼容性。   近年来为了实现知识计算和共享,DKG的研究逐渐增多。文献[11]中介绍了目前自动构建本体模型的主要方法,通过自动识别实体,语法分析获取实体之间概念上的层级关系,文中指出目前自动构建方法主要针对层次关系(is-a关系)的构建,而对于应用中的领域本体模型。大量非层次关系更为重要。因此自动构建的方法只能在领域实体和概念的发现过程中有所帮助。   从目前本体模型的研究可以发现:   (1)自动化构建本体模型的方法主要应用于UKG中的层级关系,在DKG中大量的非层级关系仍无有效地自动化构建方法,以领域专家人工构建为主。   (2)DKG在各行各业中逐渐产生重要的作用,相比DKG指导工业应用和生产的价值更高。   (3)目前没有健全的DKG本体模型的构建思路和方法。ODP的设计理念可以提高领域模型的设计规范,但仍处于工业探索阶段,仍需要大量的领域专家构建不同的DKG积累量变,逐步到质变的过程。   (4)公开的ODP中关于人物、机构、事件的ODP研究较少,目前定义最完善的

文档评论(0)

huangqiaoling1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档