- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
XML技术入门
- PAGE 34 -
XML技术入门
Internet提供了全球范围的网络互连与通信功能,Web技术的发展更是一日千里,其丰富的信息资源给人们的学习生活带来了极大的便利。特别是HTML(超文本标识语言)的应运而生,以其简单易学,灵活通用的特性,使人们发布信息、`,检索信息、,交流信息都变得如此简单,因此,Web成为了最大的环球信息资源库。然而,电子商务,电子出版,远程教育等基于Web的新兴领域的全面兴起使得传统的Web资源更加复杂化,多样化,数据量的日益趋庞大对网络的传输能力也提出更高的要求。同时,人们对Web服务功能的需求也达到更高的标准,比如需要对Web进行智能化的语义搜索;,需要更为灵活的Web应用软件等等公司企业要为服务客户创建和分发大量有价值的文档信息,以降低生产成本;需要对数据按照不同的需求进行多样化显示,实现信息推送、个性化服务等智能化服务;需要对不同平台、不同格式的数据源进行数据集成和数据转化等等,这些需求愈加广泛并且迫切。。
当前基于Web的信息处理仍面临着许多问题:公司企业要为服务客户创建和分发大量有价值的文档信息,以降低生产成本;需要对数据按照不同的需求进行多样化显示,实现信息推送、个性化服务等智能化服务;需要对不同平台、不同格式的数据源进行数据集成和数据转化等等,这些需求愈加广泛并且迫切。
但是传统的HTML由于自身特点的限制,不能有效地解决上面上述的问题。:HTML只是作为一种简单的表示性语言,它只能显示内容而无法表达数据内容,。而这一点恰恰是电子商务、智能搜索引擎所必须的。另外,HTML语言不能描述矢量图形、数学公式、化学符号等特殊对象,在数据显示方面的描述能力还是不尽人意。最重要的是,HTML只是SGML(Standard Generalized Markup Language,标准通用置标语言)的一个实例化的子集,可扩展性差,用户根本不能自定义有意义的置标供他人使用。这一切都成为Web技术进一步发展的障碍。
刚才提到的SGML是一种通用的文档结构描述置标语言,为语法置标提供了异常强大的工具,同时具有极好的扩展性,因此在分类和索引数据中非常有用。但是,SGML复???度太高,不适应适合网络的日常应用,。另外加上开发的高成本,不被主流浏览器所支持等等原因使得SGML在网Web上的推广受到阻碍。在这种情况下,开发一种兼具有SGML的强大功能和,可扩展性以及,同时又具有HTML的简单性的语言势在必行。由此诞生了XML语言。
XML(eXtensible Markup Language可扩展的标识语言)是由W3C(互联网联合组织)组于1998年2月发布的标准,。是S同样是SGML的一个简化子集,它将SGML的丰富功能与HTML的易用性结合到Web的应用中,。XML以一种开放的自我描述的方式定义了数据结构,在描述数据内容的同时能够突出了对结构的描述,从而体现出数据之间的关系,。这样所组织的数据对于应用程序和人类都是友好的、可操作的。
XML的优势之一是它允许各个组织、个人建立适合他们自己需要的置标集合,并且,这些置标可以迅速地投入使用,。这一特征使得XML可以在电子商务、政府文档、司法、出版、CAD/CAM、保险机构、厂商和中介组织信息交换等领域中一展身手,根据针对不同的系统、厂商提供各具特色的独立解决方案。
XML的最大优点在于它的数据存储格式不受显示格式的制约。一般来说,一篇文档包括三个要素:数据、结构以及显示方式。对于HTML来说,显示方式内嵌在数据中,这样在创建文本时,要时时考虑输出格式,如果因为需求不同而需要对同样的内容进行不同风格的显示时,要从头重新创建一个全新的文档,重复工作量过于繁重很大。再者此外HTML语言缺乏对数据结构的描述,对于应用程序理解文档内容,抽取语义信息都有诸多不便。
XML把文档的三要素独立开来,分别处理。首先把显示格式从数据内容中独立出来,保存在样式单文件中(Style Sheet),这样如果需要改变文档的显示方式,只要修改样式单文件就足够了。XML的自我描述性质另外能够很好地表现许多复杂的数据关系对数据结构的详细描述,使得基于XML的应用程序可以在XML文件中准确高效地搜索相关的数据内容,忽略其它不相关的部分。另此外,XML的自我描述性质也使得许多复杂的数据关系得到良好的表现。
XML还有其它许多优点,比如它有利于不同系统之间的信息交流,完全可以充当网际语言,并有希望成为数据和文档交换的标准机制。
当然,XML作为一个新建立的标准,还有许多不足之处:它在强调了数据结构的同时,语义的表达能力上还有略显不足,例如定义了地址这样一个置标,如果不是在文档中实际定义内容,我们是没有办就无法知道是要表达家庭住址还是E-mail地址的。另外,XML的有些方
文档评论(0)