- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义万维网概念方法及应用
语义万维网概念方法及应用
摘要:近两年来,语义万维网(semantic web)的研究逐渐引起了知识表示、逻辑编程、信息系统集成、web开发等各个领域的广泛关注。语义万维网的研究将对传统web上信息的发布、存储和处理方式产生一场变革,但是语义万维网的概念、思想、和方法还处于形成阶段。本文分析了语义万维网的起源、概念、技术框架、总结了语义万维网及相关工具的现状,并讨论了语义万维网技术在智能信息检索、企业间数据交换、知识管理以及万维网服务中的应用。
关键词:语义万维网 资源描述框架 知识表示 本体
0 引言
万维网创始人Tim Berners-Lee将万维网的演化分为两个阶段,在第一个阶段,万维网应该是一个有利于人们相互合作的强大工具。万维网最初十年的发展基本上实现了这个目标:它以HTML页面的方式向人提供了大量的信息。在第二个阶段,这种合作应该延伸到机器???也就是说,连接到万维网上的机器也应该能够分析万维网上的所有数据――包括内容、链接以及人与机器之间的交互。如何实现万维网的第二阶段目标正是目前学术界研究的热点。实现这一目标的难点在于传统的HTML语言本身的固有缺陷,这种标记语言的标签集只是对内容的显示格式做了标记,数据的表现格式和数据糅合在一起,缺乏针对数据内容的标签。HTML语言的这种特点决定了万维网上的信息内容很难被机器所理解,从而制约了一些需要对万维网上的海量数据进行自动化处理应用的开发。Web上海量的数据要求以一种能够理解数据语义的方式进行交换和管理,当前基于HTML的web技术却很难满足要求。
1 语义万维网的概念
什么是语义万维网并没有一个严格的定义,Tim.Berners-Lee对语义万维网做了如下的描述:语义万维网并不是一个孤立的万维网,而是对当前万维网的扩展,语义万维网上的信息具有定义良好的含义,使得计算机之间以及人类能够更好的彼此合作。
2 语义万维网的组成
2.1 URIs和Unicode Web环境下的应用之间不可避免地需要相互通信,直接或间接地以机器可读的格式传递发布信息。这些信息中很大一部分是对Web上资源的描述,因此,首先应该以明确的方式来标识这些资源(对象)。语义万维网采用统一资源标识符(Uniform Resource Identifiers,URI)来标识资源及其属性,URI是一个Internet标准,记载于RFC2396。这一层是整个语义万维网的基石,它成功地解决了万维网上资源的定位和跨地区字符编码的标准格式的问题。
2.2 XML、NameSpace、XML Schema 在URI和Unicode之上,是XML及相关技术层。XML允许用户根据需要自定义一些“有意义的”标签对发布的内容进行标记,并使用文档类型定义(Document Type Definition,DTD)或XMLSchema来约束这些标签的结构。
2.3 RDF、RDF Schema XML层的上一层是数据互操作层――资源描述框架(Resource Description Framework,RDF)和RDF schemas。RDF本身并没有规定语义,但是它为每一个资源描述体系提供一个能够描述其特定需求的语义结构的能力。RDF Schema机制提供了RDF模型中使用的一个基本类型系统。
2.4 Ontology 在某种意义上说,RDF Schema本身就是一种简单的本体(ontology)语言。但是RDF/RDFS对特定应用领域的词汇的描述能力比较弱,需要进行扩展,我们把这个RDF/RDFS之上的扩展层称为ontology层。T.R.Gruber等人对ontology给出的定义比较适用于语义万维网的研究:ontology是一种明确的共享概念化的形式说明。概念化是指对现实世界中的一些事物进行抽象建模,所建立的模型确定了该事物的一些相关的概念。明确意味着所使用概念的类型以及它们使用上的约束都有显式的定义。形式说明则是指ontology应该是机器可以理解的。共享反映了这样的一种理念:ontology表达双方都认可的知识,也就是说,ontology并不会仅仅局限于某些个体,而应该被一个群体所接受。
2.5 Logic、ProofTrust 到目前为止,利用RDF/RDFS以及对RDFS进行扩展的一些ontology语言可以对Web上的资源内容做出描述。仅有这些描述还远远不够,基于语义的web应用还需要根据特定的规则从这些描述性的知识中进行推理。逻辑层的目标就是提供一种方法来描述规则。描述逻辑标记语言(Description Logic Markup Language,DLML)就是这样的一种方法,它用DTD封
文档评论(0)