- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DBpedia说明文档.
DBpedia知识库说明文档[摘要] 在现有的语义网项目架构中,基于关联数据形式的知识库项目往往处于整个语义网络的核心,如何对于这些知识库的知识内容进行组织、储存和查找就成为了决定整个语义网络运行效率的关键因素。在目前的关联数据知识库项目中,DBpedia是较为典型且成熟的一个,DBpedia网站使用本体的方法来对其条目内容进行组织和存储。一、DBpedia本体的类和条目属性分析根据斯坦福大学医学院发本体的构建七步法,构建本体有如下七个步骤:确定本体的专业领域与范畴考察复用现有本体的可能性列出本体中的重要术语定义类和类的等级关系定义类的属性定义属性的分面创建实例但以上所述的七步法仅适用于某一专业或学科领域本体的构建。在DBpedia知识库一例中,由于所需要构建本体的是维基百科条目,因此其专业领域与范畴无法简单确定,因此在DBpedia的本体构建中,采用了类似于以叙词表为基础的自动化本体转换的方式。但同样的,维基百科的词条表并非规范的叙词表,其类目划分也无法简单归于某一专业分类之下,词语的专指度不可避免的出现不足,因此,在DBpedia的本体构建中,类目划分和定义基本是人工完成,之后的条目转换才使用了自动转换的方式。1.1 DBpedia类共有属性分析本体的体系结构主要包括3个要素:核心元素集、元素间的交互作用以及这些元素到规范语义间的映射关系。对于本体的一般构造过程,可以用以下公式进行表示:本体 = 概念(Concept) + 属性(Property) + 公理(Axiom)+ 取值(Value)+ 名义(Nominal)从以上的一般公式中,我们还可以归纳出本体当中的基本关系类型,共有四类:part-of关系,表达概念之间部分和整体的关系kind-of关系,表达概念之间的集成关系instance-of关系,表达概念的实例和概念之间的关系attribute-of关系,表达某个概念是另一个概念的属性由于DBpedia知识库的本体从分类上属于知识本体,因此在类和条目的属性设置上需要体现以上四种关系。如图1所示,DBpedia的类除了名称这一唯一标示之外,还有如下共有属性:图 1 DBpedia类属性实例Type属性,类型是类与条目的根本性区分,以图中‘Film’这个类为例,它的类型属性值是‘Class’,而该类下属的具体电影条目的属性则是‘Film’。Istypeof属性,这一属性列出了该类下属的所有条目SubclassOf属性,这一属性表明该类的上级类IsSubclassOf属性,这一属性表明该类的下级类Sameas属性,这一属性值指向一个URI,其中说明了所有跟该类同义的词语以上是DBpedia本体类的五个共有属性,从该属性定义中可以看出,由于条目数量多,类目归属复杂,DBpedia类的属性定义较为简单。但仍能体现概念之间的关系。此外,由于名称的复用可能存在,因此DBpedia类和条目的属性命名匹配规则都较为严苛。仍以图中Film类为例,当以film为索引词查找该类时,无法直接得到反馈结果。由于DBpedia的使用用户生成内容较为随意,在创建本体时为类和条目添加了Sameas属性,以反映不同名称的同一事物。1.2 DBpedia条目属性分析在DBpedia本体体系当中,条目与类是两种不同属性的概念。简单的区分而言,DBpedia本体体系中的条目相当于一般本体体系中的概念、属性和取值的集合,三者共同描述某种客观事物,而类则相当于一般意义上的分类概念,并不指代某种具体事物,而是一类事物的共有概念。因此,DBpedia本体的条目属性除了表明其与类和其他概念的关系和联系之外,还根据其所属的类拥有各自独特的属性。图2 DBpedia条目属性实例从实例条目中,DBpedia条目所共有的关系属性仅有一条,即:Type,如类属性,在不同的本体语言下其Type定义不同。在DBpedia本体语言下,条目的Type属性是其所有上级类。如例所示,该条目所描述的运动员从属于“运动员”、“花样滑冰运动员”和“人”三个类,因此其Type属性在DBpedia本体语言下有三个值。而根据其从属类的不同,DBpedia本体体系中的条目拥有独特的用以说明其概念的属性,如上例的运动员有“出生年月”、“性别”等属性。1.3 DBpedia本体属性设置的评析从实例分析中,不难看出,DBpedia的本体设计和构建符合以上本体构建原则。尽管由于原维基百科的条目存在重名,以及单个概念在不同领域的不同含义等问题,但在DBpedia本体的构建过程中,以名称为区分条目和类的最根本区别。使用了添加后缀等命名规则来区分在原维基百科条目中重名条目。同时,针对不同类或条目所涉及的不同概念,合理的添加了能够反映其概念特质的属性。同时,针对不同本体语言,DBpedia还对同一属性做了不同取值,这样
文档评论(0)