10语义网基础教程-XML.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10语义网基础教程-XML

XML结构化网络文档 本章知识要点 引言 XML语言 结构化 命名空间 XML文档的寻址和查询 处理 XML语言产生的动机,下例中的网页包含一本书的信息。 相同信息的典型XML表达如下: HTML和XML比较: 相似之处:这两种表示方法都用到了标签(tag),例如h2和/year,两者都是建立在标签之上的,标签可以嵌套使用;XML标签都必须按一定规则配对使用,而HTML允许一些标签如br无需配对。 不同之处:HTML文档不包含结构信息,即文档成分及其相互关系的信息。XML文档描述了文档的每一成分,XML嵌套结构定义了文档成分之间的关系。例如,author标签出现在book标签的辖域内,所以author标签描述的是这本特定的书的属性。 HTML表示描述了文档的格式,这是XML表示所没有的,XML的内容和格式是分开的。XML是一种关于标记的元语言—没有固定的标签集,而是有用户自行定义自己的标签。W3C也在XML之上定义了多种语言,比如SVG和SMIL,RDF。 1.XML Language 一个XML文档包含一个序言、一系列元素和一个可选的尾注。 1.1序言 XML文档的序言由一个XML声明和一项可选的对外部结构化文档的引用组成。下面是XML声明的一个例子: 上述声明指定当前文档是XML文档,并且定义了文档的版本号和特定系统下的字符编码方式,字符编码方式不是强制的,但是指定编码是一个好习惯。有时也会指定文档是否是自包含的,也就是说,它是否是引用外部结构化文档: 对外部结构化文档的引用可以是这样的: 此例中文档的结构信息在本地文件book.dtd中,当然引用也可以是一个URL,如果仅使用本地可识别的名字或者仅使用URL,那么就用SYSTEM标记,如果这两者都用的话,就要用PUBLIC标记 1.2元素 XML的元素代表XML文档描述的“事件”,比如书籍、作者和出版商。一个元素由一个起始标签、元素内容和一个结尾标签构成。 例如: 用户可以随意选择标签名,只有很少的限制。 元素内容可以是文本,或者其他的元素,或为空,例如: 如果一个元素不包括任何内容,则称为空元素 1.3属性 属性是元素的起始标签中的名字-值(name-value)对,例如: 下面是一个非空元素的属性的例子: 也可以通过把属性改写为嵌套元素的形式来表达: 使用元素写法还是属性写法通常只是个人偏好,但要注意属性不能嵌套。 1.4 注释及处理指令 注释是一段文本,分析器会忽略这行文本。注释形式如下: 处理指令提供一种向处理元素的应用传递信息的机制,一般形式如下: 例如: 处理指令提供一种在另外的说明性表示中增加过程性处理的可能。 合式XML文档 如果一个XML文档的语法正确,那么它就是一个合式XML文档。部分语法规则如下: 在文档的最外层只能有一个元素(称为根元素)。 每个元素都包含一个起始标签和一个与之对应的结尾标签。 标签之间不可以重叠,如下例为形式违法: 同一个元素内部的属性名不可相同。 元素名和标签名必须合法。 XML文档的树形模型 可以把合式XML文档表示树形结构,因此树形结构为XML提供了一个形式化的数据模型。 图2.1显示了这个XML文档的树形表示。这是一棵含有序关系并带有标记的树: 仅有一个根节点。 树中无环。 除了根节点之外,每个节点仅有一个父节点。 每个节点都有一个标记。 元素的次序是有意义的。 尽管元素的次序有意义,属性间的次序却是无关的,故而下面两个元素是等价的: 在树形表示中没有充分地反映出这一点,需要一种更为细致的树形概念,比如要区分不同类型的节点。这里仅用树形结构做图示说明。 在email元素的例子中,图2.1表现了根(代表XML文档)与根元素之间的区别。 2. 结构化 XML文档遵循一定语法规则,称其为合式XML文档。为了提高文档有效性,要使用并遵循结构化信息。定义文档结构:元素类型、元素之间的关系、属性使用的值类型等。有两种XML文档结构的方式: DTD XML Schema 2.1 DTD 方式 一个DTD的组成部分可以定义在另一个独立的文件(外部DTD)中,也可以定义在该XML文档自身(内部DTD)中。通常情况下,使用外部DTD较好,因为它的定义可以被几个不同文档使用;否则就会出现重复,而且一致性的维护也会变得困难。 元素 考察上一节例子中的元素: lecturer nameDavid Billington/name phone+61-7-3875 507/phone /lecturer 这

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档