- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章 XML语言简介 1.1 置标语言概述 传统意义上的标记(markup)我们经常会遇到。例如,老师批改过的试卷,经常是满篇红色醒目的对号、错号、问号、波浪线或者意味深长的评语,这些都是标记;我们在看书的时候,也喜欢用荧光笔将重要的内容加亮,以帮助我们在日后重读文章时,能够提纲挈领、迅速抓住要害,这也是标记。从广义上来说,一篇文章中的标点符号、空格等都可以称做标记。这些标记使我们接触的文档具备了不同的意义,并协助我们完成不同的目标。 所谓置标语言(markup language),则特指用一系列约定好的标记来对电子文档进行标记,来实现对电子文档的语义、结构、格式的定义。这些标记应该与文档内容相区分且易于识别。标记语言必须定义什么样的标记是被允许的,什么样的标记是必需的,标记是如何与文档的内容相区分的,以及标记的含义是什么。 1.1.1 SGML语言起源 为了促进数据的交换和操作,人们很早就产生了将文件结构化为标准格式的动机。20世纪60年代,IBM公司创建了GML(Generalized Markup Language,通用置标语言),以在其出版系统内部实现这一需求。 SGML(Standard Generalized Markup Language,标准通用置标语言)从IBM的GML演化而来,是第一个标准化的信息结构化技术。SGML成为了IBM内部格式化和维护合法文件的手段。 SGML后来被扩展和修改,作为一种全面的信息标准以适应工业范围的广泛应用。但直到1986年,SGML才成为了ISO标准。尽管SGML的功能非常强大,但是由于它非常复杂,需要许多昂贵的软件配合运行,因而在很长一段时间都没有被推广。 1.1.2 HTML语言及其局限性 1989年,欧洲粒子物理实验室(CERT)的研究员Tim Berners-Lee和Anders Berglund创建了一种基于标记的语言,为在Internet上共享的文章做标记,这就是HTML。HTML可以看做是SGML的简化应用,它的诞生,推动了信息产业的大发展。 HTML(Hyper Text Markup Language,超文本标记语言)是一种用来制作超文本文档的简单标记语言。用HTML编写的超文本文档称为HTML文档,它能独立于各作操作系统平台(如UNIX、Windows等)。自1990年以来,HTML就一直被用作World Wide Web(WWW)上的信息表示语言,用于描述Homepage的格式设计和它与WWW上其他Homepage (Hyperlink)的链接信息。HTML语言是通过利用各种标记(tags)来标识文档的结构及超链接信息的。 HTML之所以能够流行,是因为它有简洁的语法。但也正是由于它过于简洁,也产生了以下几个主要问题: (1) 标记扩展复杂。 HTML当初仅仅提供了一种对静态文本信息表现的方法,但显然并不能适应越来越多的需要。随后越来越多的标签产生了,例如img用于描述图片,script通过为网页加入脚本支持来提供动态网页内容。日益增多的标记不但使HTML越来越庞大,浏览器的开发越来越复杂,还降低了不同浏览器之间的兼容性。 (2) 缺乏严格的语法定义。 HTML文档的正确性很难得到确认。为了使文档的显示过程更加强健,浏览器通常忽略语法分析,不检查语法的正确性。 (3) 结构化支持差。 HTML缺乏对复杂结构的支持,例如HTML不能支持分层嵌套信息结构。HTML文档间的联系完全是平面的,这限制了全文检索技术的应用,也使得浏览的过程显得笨拙而繁琐。 (4) 数据、格式、超文本及图形用户界面语义混合。 ① 内容提取困难。搜索引擎机械地逐一检索每个页面中所有可以匹配的内容,所以我们往往会得到太多的、难以判断的数据采样。这是由于HTML混淆了数据内容和数据表达,数据内容和数据表达信息都被显式地写在同一文档中的缘故。当我们希望看到用不同表现形式表达的同一内容时(比如需要一个用大号字体排印的版本),就不得不从服务器直接产生。同样,在网页显示上的任何其他变化也都必须由开发者亲自实现。 ② 难以实现数据交换。HTML难以实现自动的数据交换,它的标签只用来控制文档的显示,却不能标示出数据域。 ③ 信息重用性差。HTML不易重复使用已有的信息。如果要重新在网上发布同样的信息,或者希望为已有的信息编辑可打印的目录,或需要把网上的数据存入数据库,往往不得不用手工进行处理,更糟糕的是,当网上的数据发生变化时,这些过程都必须重做。 HTML存在的这些问题随着互联网的蓬勃发展不但没有得到解决,反而越来越突出,成为HTML继续发展应用的障碍。 1.1.3 XML语言的诞生及其优点 1
您可能关注的文档
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目二 使用Word制作杂志页.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目九 使用Word制作小报.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目六 使用Word制作成绩通知单.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目三 使用Word制作履历表.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目十 使用Excel制作校历.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目十二 使用Excel制作奖金发放表.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目十六 使用Excel查询销售表.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目十三 使用Excel制作成绩分析表.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目十四 使用Excel制作公司利润表.ppt
- Word 2000、Excel 2000实用教程 第二版 教学课件 作者 高长铎 胡维青 项目十五 使用Excel制作人事信息表.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第2章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第3章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第4章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第5章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第7章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第8章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第9章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 第10章.ppt
- XML案例教程高职 教学课件 作者 眭碧霞 全书 封面及目录.ppt
- XML编程与应用教程 教学课件 作者 978 7 302 22348 1 第1章 XML概述.ppt
文档评论(0)