- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章绪论
或框架。
第四层是本体层(Ontology),用来处理RDF数据查询并定义RDF中所使用
词汇的含义及其关系。本体层在RDF(S)fl勺基础上定义其概念及关系的抽象描述,
通过描述应用领域的知识和各类资源及资源之间的关系,实现对词汇表的扩展。
在这一层,用户不但可以自定义概念而且还可以定义它们之间的逻辑关系。
第五至七层分别是逻辑层、验证层和信任层。其中,逻辑层是在底下四层的
基础上增添了用于逻辑推理的规则;验证层用于支持用户只能代理之间建立信任
关系的证明交换;信任层用于建立语义网资源信息组织中涉及到相关信任信息。
1.2.2语义网的特点
作为新一代的互联网,语义网在继承现代万维网的基础上,也提出了自己的
特点。
理解文本的内在含义是语义网的最大特点。传统基于超文本传输协议的万维
网主要关注于文本内容的外在呈现,着重描述文本的显示格式:而语义网更加关
注文本的语义信息,通过采用RDF和Ontology技术将文本的元素形式化的表现
给机器,使得机器可以了解文本内容。同时,语义网使用着重描述概念、实例之
网能够容易的理解其所表达的文本信息。
基于文本信息的表达方式方便用户快速和准确的查找。随着信息的指数级增
长,万维网存储着海量的信息,以至于用户需要的查找不能够准确、快速的实现,
即便是搜索引擎,也只是在抓取相关信息后进一步的加工,这样既耗时也需要额
外的开销,同时还不能保证结果的准确率。而对于语义网来说,其相关语义信息
在文本的描述过程中已经完成了部分工作,为检索工作提供了便利。而且语义网
可以了解文本内容,从而剔除了一些没用的信息,提高查询的效率。
1.2.3语义网研究现状
目前,语义网的研究主要分为三个方向:(1)语义网及其关键技术,包括语
义网的体系结构,XML、RDF和Ontology三大相关技术等;(2)语义网对其他学
科或领域的影响,如信息检索,数据挖掘等;(3)针对语义网的具体实验和应用,
包括RDF数据集的存储和查询,Ontology的构建和管理等。
作为一个新兴的研究领域,语义网的实际应用还比较少,没有大范围的使用。
目前语义网研究的热点放在了本体进化、本体信息挖掘等,虽然语法层和资源描
述层的问题基本解决,但大部分RDF数据存储和查询都是利用现有的成熟数据
第一章绪论
库管理技术,将元数据存储在数据表,如何更有效的存储语义网数据还有待解决。
1.3研究内容和组织结构
本文的研究内容是在对己实现RDF存储与查询的数据管理系统RDFBase进
行查询优化和实验评估,研究重点是:(1)介绍RDF和SPARQL相关知识,如
何存储和查询RDF数据;(2)查询优化,对现有的数据管理系统提出一种基于
星型结构的查询优化,提高RDFBase系统的查询效率;(3)性能评估,通过与
成熟的原型系统进行实验比较,查看RDFBase的优点和不足。
文章的内容安排如下:第一章阐述语义网的背景知识,论文的研究目标以及
组织结构:第二章介绍语义网相关的技术,包括RDF和SPARQL查询:第三章
论述RDFBase数据管理系统,包括存储管理和查询处理;第四章研究系统的查
询优化,重点介绍基于星型组的优化方案,主要包括该方法的算法、实现及其他
方面的内容;第五章对RDFBase进行性能评估,通过实验比较RDFBase与现存
的语义Web软件的差异;第六章总结目前RDFBase系统的工作情况以及未来的
研究方向。
4
第二章语义网基础
第二章语义网基础
语义网的核心是显示的表达文本信息,而这信息又隐藏于网络资源数据中,
如何解决资源描述和揭发语义信息是两个重要问题。为了表达和揭发数据语义信
息以及方便数据的查询操作,W3C提出了RDF技术和SPARQL查询语言。
2.1RDF技术
现在的万维网模型主要是面向用户的浏览和搜索,随着网络信息的指数级增
加,现有的模型己不适合海量数据的交换和查询。虽然XML模型可用于数据的
表示和交换,但缺乏描述语义信息的能力,为此W3C采用资源描述框架RDF
和RDF
Schema描述网络上的信息资源,为其赋予语义。RDF是一种提供描述
Web资源信息数据的通用语言和方法,拥有简单的语义,同时遵循XML语法和
原创力文档


文档评论(0)