基于存储优化模型的rdf数据查询机制分析-analysis of rdf data query mechanism based on storage optimization model.docxVIP

  • 9
  • 0
  • 约5.05万字
  • 约 49页
  • 2018-05-18 发布于上海
  • 举报

基于存储优化模型的rdf数据查询机制分析-analysis of rdf data query mechanism based on storage optimization model.docx

基于存储优化模型的rdf数据查询机制分析-analysis of rdf data query mechanism based on storage optimization model

优秀毕业论文 精品参考文献资料 1 绪论 本章首先介绍 RDF 数据存储和 SPARQL 查询的研究意义;接着介绍 RDF 数据 存储和 SPARQL 查询系统的国内外研究现状;然后说明论文的研究背景和研究内容; 最后介绍论文的组织结构。 1.1 问题的提出 语义网是由万维网的创始人 Tim Berners-Lee 于 2000 年提出,它是关于下一代互 联网的设想,万维网联盟(World Wide Web Consortium,简称 W3C)提出了许多促 进语义网相关技术发展的标准[1]。语义网概念是在自然语言处理技术不能够完全处理 非结构化和半结构化数据的背景下提出的[2],它是当前万维网的延伸,它的核心思想 是创造更多的让机器能理解的数据[3],通过在对互联网上的数据引入相关的语义标准 进行描述,使得数据表现出清晰的语义和结构化,从而使得这些数据能够被机器所 理解。语义网概念的提出符合互联网发展的趋势,使得互联网的数据更加规整化, 并且有序。为了能够使语义网的概念成为现实,必须有大量的数据遵循某种标准格 式,这种格式能够被机器“理解”和管理。为此万维网联盟的语义网活动给出了语 义网的七层结构[4],如图 1.1 所示。 图 1.1 语义网的七层架构 在语义网的七层体系结构中,可扩展标识语言(Extensible Markup Language,简 称 XML)作为语法层,而资源描述框架[5](Resource Description Framework,简称 RDF)作为描述语义网数据的通用语言,是语义网描述网络上数据的基础。而 RDF 的层次架构之上可以使用 RDF 模式(Resource Description Framework Schema,简称 RDFS)和网络本体语言[6](Web Ontology Language,简称 OWL)进行描述,通过一 些内建的推理规则,能够对 RDF 数据进行逻辑推理操作[7]。而 SPARQL[8] (Simple Protocol and Query Language)作为 RDF 数据的查询语言,SPARQL 是构建在以前的 RDF 查询语言[9] (如 SeRQL,RDQL 等)之上,拥有一些有价值的新特性,目前成为 万维网联盟(World Wide Web Consortium,简称 W3C)查询 RDF 数据的推荐标准, SPARQL 的语法与 SQL 语法相似,但是 SPARQL 较为复杂[9],被定义为可以实现异 构 RDF 数据的查询。资源描述框架(RDF)提供了标准的格式对互联网的资源进行 描述,其描述的灵活性很强,目前 RDF 提供了许多词汇的??持,如 Dublin Core、FOAF (Friend of a Friend)和 RSS 1.0,SKOS(Simple Knowledge Organization System), 以及 RDFa,GRDDL(Gleaning Resource Descriptions from Dialects of Languages)等, 通过这些词汇的支持可以进一步增强互联网上文档的语义。维基百科作为强大的自 由百科全书,体现了人类智慧的精华,其数据量非常庞大,目前研究者对其数据进 行了重新整合和描述[11],以便进一步的使用这些数据。而 Yago[12],DBPedia[13],使 用自然处理,信息抽取等技术将维基百科上的内容转换成结构化数据,使用 RDF (Resources Description Language)来描述。其中 DBPedia 使用 Virtuoso[14]和 MySQL 作为底层存储系统,同时开放了 SPARQL 查询接口。目前,DBPedia 的数据已经被 很多语义网应用程序所使用。随着使用语义网标准描述的数据的不断增多,Tim Berners-Lee 提出了连接的数据(Link data)的概念,其中 Tabulator[15]工具可以浏览 各个数据源的语义网数据,提供了异构语义网数据的可视化,而 Sindice[16]则通过对 语义网数据进行索引,提供丰富的语义网数据搜索功能。 语义网数据在不断的增多,构造高效的存储和查询这些语义网数据的系统成为 语义网应用得到普及的一个非常重要的方面,而 RDF 作为语义网数据的描述基础, 因此研究 RDF 数据的高效存储和查询成为了语义网研究的热点。目前出现了许多以 关系数据库作为后端的 RDF 数据存储和查询系统,如 3store[17],Jena SDB[18], Sesame[19]等,采用关系数据库作为后端对 RDF 数据以三元组表或者类似的方式进行 存储。采用三元组的存储方式很好的利用了关系数据库的性能,但是三元组的存储 方式

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档