语义网初步探讨.docVIP

下载本文档

1
0
约4.42千字
约 9页
2018-09-20 发布于福建
举报
版权申诉

语义网初步探讨.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语义网初步探讨

语义网初步探讨　　[摘要]语义网并非一个独立的Web,而是当前Web的延伸,其目标是让计算机能够“理解和处理”现在的Web仅仅能显示的数据,并为人们提供各种智能服务。因此,在对语义网及其体系结构分析的基础上,探讨当前语义网的应用。　　[关键词]语义网络万维网计算机　　中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)1220031-02 　　　　一、语义网概述　　　　为了改善当代万维网信息不利于计算机自动处理的现状,万维网的创始人TimBerners-Lee于1998年提出了有关下一代万维网的构想――语义万维网(Semantic Web)。语义万维网是一个梦想:期望Web上的数据通过另外一种不同于现在的方式描述和链接,使这些数据不仅能以各种灵活的方式展现出来,也能被不同的应用程序所自动处理、综合、重用。在语义万维网中,网页中所蕴含的语义信息能使计算机完成大部分的自动化处理工作,例如软件代理程序通过网页中的语义可以为用户完成复杂的旅行计划制定等任务,即从当前“机器可阅读”的万维网扩展为“机器可理解”的语义万维网。　　Tim Berners-Lee并没有给出语义万维网的严格数学定义,只是在和当代万维网的对比中,给出了如下的描述:语义万维网并不是一个从无到有、孤立发展的万维网,而是对当前万维网的延伸和扩展,语义万维网上的信息具有定义良好的含义,计算机能根据概念的定义声明和逻辑推理规则发现资源对象的含义,使得机-机之间以及人-机之间都能够更有效地合作处理;在语义万维网中定义和链接的数据能被各种不同的应用以更为有效的方式查询、重用和集成。　　语义万维网不仅是一个存储文档对象集合(如网页、图片、视频音频等)的网络,它更是一个描述现实世界对象资源关系的网络。因此,和当代万维网相比较,语义万维网的另一个显著特征就是其包含了更多机器可阅读和理解的语义信息。HTML和语义万维网的关系是:万维网作为世界上最大的信息储藏所,其中蕴含的信息量超过世界上任何一个图书馆,在这一点上,HTML功不可没,正是通过HTML中的超链接,才得以将世界上的各种信息资源链接在一起。但丰富多彩的现实世界中还存在着各种复杂的关联关系,这就要求语义万维网不仅要能反映资源之间的超链接关系,而且还应能描述资源对象之间的丰富而又复杂的关联关系,对这种复杂关联关系的描述正是语义万维网的优势所在。　　　　二、语义网的体系结构　　　　信息资源根据其所处层次的不同,可以被划分成不同的阶或者势,其中现实世界中未经加工处理的信息属于零阶,在整个信息层次结构中处于最底层;网页资源信息处在第一阶;在对HTML页面经过初次加工之后,所获取的网页标引或索引信息处在第二阶;有关信息资源对象的元数据或模式信息则是属于第三阶的信息;而逻辑推理、真值证明等信息理应拥有更高的阶值,在信息层次结构中,阶值越低的信息越具体详实,较适合于人为处理;阶值越高的信息其抽象程度越高,则更适合于机器的自动化处理。当代万维网上的信息是杂乱的、无序的(或者说是非矢量的),将数据内容和表现形式混在一起,其中不同“阶”的信息没有被区别对待,这就导致了人们在信息使用上的困难。因此,语义万维网首要解决的问题就是建立起合理的信息层次结构,使其上面的信息是结构良好且有序的。　　Berners-Lee于2001年提出了语义网的体系结构(见图3-1),并对此做了简单的介绍。该体系结构共有七层,自下而上其各层功能逐渐增强。　　第一层:Unicode和URI。Unicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。使用Unicode,达到了语义万维网的最终目的:是要构建一个全球信息网络。在这个网络中应该能覆盖各种语言和文字的信息资源。URI(Uniform Resource Identifier),是一个internet标　　准,即统一资源定位符,用于唯一标识网络上的一个概念或资源。在语义网体系结构中,该层是整个语义网的基础,其中Unicode负责处理资源的编码,URI负责资源的标识。这一层位于语义万维网中的最低层,它成功地解决了万维网上资源的定位和跨地区字符编码格式的问题。　　第二层:XML+NS+xmlschema。XML是一个精简的SGML,它综合了SGML 　　的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。NS(Name Space)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是DTD(Do