[XML原理及應用]02-XML基础.doc

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[XML原理及應用]02-XML基础

第一章XML基础 本章要点: ? XML基础知识 ? HTML的基本标记及应用 ? XML的应用 1.1 XML的发展历史 XML是可扩展标记语言(EXtensible Markup Language)的简称,它的先驱是SGML和HTML,它们都是很成功的标记语言,但是在某些方面,这两种语言也存在着自身的一些缺陷,XML正是为了解决它们的不足而产生。 XML通过允许编程者重用称为XML处理器(Processor)或解析器(Parser)的代码片段而节约开支。 理解XML核心思想的最简单方法就是追溯其源头——SGML(标准通用标记语言)。 1.1.1 SGML语言 SGML是在深厚的文本处理系统背景上发展起来的。文本处理是计算机科学的一个分支 学科,旨在创建可以自动化部分文档生成和发布流程的计算机系统。文本处理软件包括简单 的文字处理、高级新闻项目数据库、超文本文档表示系统以及其他发布工具。 自动化文本处理的第一次浪潮是计算机排版。用户只需键入文档并描述其格式化方式。计算机就会根据所描述的文本和格式输出文档。 我们把包含实际文档数据及所需格式描述等混合内容的文件格式称为重现(Rendition)。 一些发展史上重要的重现表示法包括troff、RTF(Rich Text Format)和LaTeX。 排版系统可以把这种重现转换成人类可以理解的某种形式——即显示(Presentation)。传统的显示介质是纸,但最终会是电子显示器。 排版系统加速了文档发布过程,并发展成为目前所谓的桌面发布系统。Microsoft Word和Adobe PageMaker之类的新型程序仍然处理重现,但它们向用户提供操作重现的更友好界面重现(其中带有格式化代码的文件)的用户界面设计得看上去类似于显示(纸质成品)。我们把这种发布方式称为WYSIWYG(What You See Is What You Get——所见即所得)。由于重现仅仅是描述表示,因此用户界面理应反映最终产品。 1.格式标记 所见即所得之前的排版表示法称为格式标记(Formatting Markup)。下面类比说明:假定作者向排版员提交了一份手稿以备出版,如果该手稿没有任何格式,甚至没有段落和字体区分,而只是单个“标记”和如何排版的书面指令。作者可以书写非常准确的排版指令说明:“把这个单词移动两英寸,用粗体。移动位于其旁边的下一个单词。移动位于其下面的下—个单词,用粗体。从这里另起一行。”等等。 格式标记与此非常类似。我们采用称为标注(Tag)或代码(Code)的指令“环绕”文 本(是用标注还是用代码指令根据具体格式标记语言而定)。 2.通用标记 大约在20世纪60年代后期,人们开始希望从其文档中获取更多东西。特别值得一提的是,IBM 要求一个名叫Charles Goldfarb的年轻研究人员构建一个系统,用来存储、查找、管理和发布法律文档。 Goldfarb发现,IBM内部的很多系统相互之间无法通信。它们不能交换信息。它们各自使用互不相同的命令语言,彼此无法读取对方的文件,就像我们无法在Word中加载WordPerfect文件(或相反)—样。与现在的情况类似,当时的问题就在于它们都采用不同的信息表示(有时也称为文件格式)。 20纪60年代后期,Goldfarb和其他两位IBM研究人员Ed Mosher及Ray Lorie开始着手解决这一问题。这个三人研究小组认识到,这种语言理应需要文档三个基本特征: (1)公共数据表示:标记。 (2)不同的计算机程序和系统理应能够读写表示相同的信息。 (3)标记应可扩展。 必须交换各种各样的信息类型。这种标记语言必须具有足够的扩展能力以便支持所有信 息类型。 文档类型需要规则。 1986年,国际标准组织(ISO)最终采纳该语言为标准通用语言(SGML)。 SGML提供一套复杂的系统来对文档进行标记操作,使得文档外观独立于特定的应用软件。SGML语言庞大、功能强、选项多、使用于需要有严格文档标准的操作。 同时,SGML也可用于创建更多的标记语言,为其语法提供强大的工具,而且该有很好 的扩展性。 20世纪80年代,SGML较多的用于科技文献和政府的办公文件中。 但是,SGML强大功能的背后是它的复杂性,所以不适合在Web中快速简便的发布。 1.1.2 HTML语言 HTML(超文本标记语言)是一种的特殊的SGML文档类型。HTML最初于1990年由CERN设计,它是非常简单的SGML语言,由于它的学习和实现非常容易,而且还免费提供源代码,因此,HTML很快得到Web浏览器厂商的支持。后来,W3C(万维网联盟)承担了HTML的开发和标准化任务,从1993年的HTML1.0标准到现在的HTML4.0标准,经历着不断的完善和改进。 但是,HTML

文档评论(0)

fv45ffsjjI + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档