第5章 可扩展语言XML0109.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 可扩展语言XML0109

第5章 XML基础 本章首先介绍XML的产生、它的特性以及XML的语法,5.3节和5.4节重点介绍XML中的文档格式定义的两种方式DTD和XML Schema,本章最后介绍XML的显示、编辑和解析技术。通过本章的学习,可以使读者对XML基础有大致了解。 5.1 XML概述 XML是什么,它有什么用处?通过Jeffrey Zeldman的解释可以了解:“当XML(扩展标记语言)于1998年2月被引入软件工业界时,它给整个行业带来了一场风暴。有史以来第一次,这个世界拥有了一种通用且适应性强的用来结构化文档和数据的格式,它不仅仅可以用于WEB,而且可以被用于任何地方。” 本节首先给出HTML存在的缺陷,由于它的缺陷产生了XML。最后介绍了XML的特性和XML的语法结构。 5.1.1 HTML缺陷 HTML的流行因素在于它有简洁的语法,它有结构化、实现独立和可描述性等优势。但是由于它过于简洁,使其本身存在了多个缺陷。 第一,HTML是把数据和显示格式一起存放的,不能分离二者。它的语法检查困难,HTML 文档由于缺乏严格的语法定义作为约束条件,它的正确性很难得到确认。还有,它不能实现自动的数据交换。它的标签只用来控制文档的显示,不能标示出数据域。它还不易重复使用已有的信息,如果要重新在网上发布同样的信息,或者对有的信息编辑可打印的目录,或把网上的数据存入数据库时,往往需要手工进行处理,如有改动,还需重新执行这些工作。 第二,HTML对超文本链接支持不足,属于单点链接。由于网站的设计者通常不能及时地改变自己网页中的URL以适应链接的变化,这样会导致无效链接的存在。 第三,HTML缺乏空间立体描述,处理图像、图形、音频、视频等多媒体能力较弱。 第四,HTML缺乏对复杂结构的支持。比如HTML不能支持分层嵌套信息结构,HTML 文档间的联系是二维的,这限制了全文检索技术的应用。再有,其搜索引擎机械地逐一检索每个页面中所有可以匹配的内容,会产生太多的,难以判断的数据信息。 最后,HTML的标记有限,可扩展性差,不能由用户扩展自己的标记。 正是由于HTML这些不可忽略的缺陷,W3C提出了一种新的标记语言XML。 5.1.2 XML的产生 XML的产生,需要先了解一下标准通用标记语言(SGML,Standard Generalized Markup Language)。SGML最初是由IBM开发的一种用于排版的标记语言,称为GML。经过若干年的发展,1984年国际标准化协会(ISO)开始对此提案进行讨论,于1986年正式承认SGML为国际标准规范(IS08879)。 SGML实际上是一种通用的文档结构描述标记语言,主要用来定义文献模型的逻辑和物理类结构。一个SGML文件由三部分组成,即语法定义、文件类型定义(DTD,Definition Type Document)和文件实例。语法定义部分定义了文件类型定义和文件实例的语法结构;文件类型定义部分定义了文件实例的结构和组成结构的元素类型;文件实例是SGML语言程序的主体部分。 但是SGML过于复杂,很难编写出针对这种语言的解释器,而XML作为SGML的自己,相对就简单很多。 XML(Extensible Markup Language,可扩展置标语言)是为文本交换所设计的,并以一种开发、自我描述方式定义数据结构。在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。这样的数据组织对于应用程序和用户都是友好的、可操作的。 XML实际上是Web上表示结构化信息的一种标准文本格式,它没有复杂的语法和包罗万象的数据定义。XML同HTML一样,都来自SGML(标准通用标记语言)。SGML是一种在Web发明之前就早已存在的用标记来描述文档资料的通用语言。但SGML十分庞大且难于学习和使用。鉴于此,人们提出了HTML语言。但近年来,随着Web应用的不断深入,HTML在需求广泛的应用中已显得捉襟见肘,有人建议直接使用SGML作为Web语言。但SGML太庞大了,学用两难尚且不说,就是全面实现SGML的浏览器也非常困难。于是Web标准化组织W3C建议使用一种精简的SGML版本——XML。XML与SGML一样,是一个用来定义其他语言的元语言。与SGML相比,XML规范不到SGML规范的1/10,简单易懂,是一门既无标签集也无语法的新一代标记语言。 XML继承了SGML的许多特性(与5.1.3节合并!!!): 首先是可扩展性。XML允许使用者创建和使用他们自己的标记而不是HTML的有限词汇表。这一点至关重要,企业可以用XML为电子商务和供应链集成等应用定义自己的标记语言,甚至特定行业一起来定义该领域的特殊标记语言,作为该领域信息共享与数据交换的基础。 其次是灵活性。HTML很难进一步发展,就是因为它是格式、

文档评论(0)

sxa632 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档