- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                XML解析技术分析和总结
                    XML解析技术分析和总结
    摘要:随着XML的广泛应用,大量的信息都将通过XML文档来进行存储、交换,因此xML解析技术成为XML应用的关键。本文通过对4种解析技术进行分析和总结,同时本文也介绍了XML解析技术的实现细节,总结归纳了在应用系统中选择合适的XML解析技术的方法,加深理解实现选择解析技术的原则。 
  关键词:XML文档 
  解析 
  中图分类号:TP312 
  文献标识码:A 
  文章编号:1002-2422(2010)03-0132-02 
   
  XML(Extensible Markup Language。可扩展标记语言)与HTML一样,都是标准通用语言。是W3C制定的一组规范,用来定义文档标记语言的框架,同时作为一种便捷的数据操作和数据传输的工具,提供了一种描述结构数据的格式,XML以简单性、开放性、可扩展性、互操作性等一系列特性给基于Web的应用程序带来了强大的功能和灵活性,因此在现今的Web开发中发挥着越来越重要的作用,使得针对XML文档的操作也越来越频繁。XML也为三层B/S/S应用程序开发提供了所需的技术,使本地化计算和操作成为可能。其另一特性是粒状更新,从而改善了服务器的可缩放性。 
  由于XML技术的方便性和高效性,一些用于处理XML文档的解析技术应运而生。作为XML应用的基础,XML解析技术一直是XML领域的研究热点。所谓XML文档的解析就是把代表XML文档的一个无结构的字符序列转换为满足XML语法的结构化组件的过程。在提高解析性能、降低资源占用、改善XML解析器的可用性上,人们做了大量的研究和实践工作。但是,验证过程降低了解析器的性能。如何兼顾错误检测能力和性能,已成为XML解析的挑战。目前主要有四种对XML数据进行解析的技术:(1)DOM(Document Ob-iect Model,文档对象模型);(2)SAX(Simple API for XML,用于XML的简单API);(3)JDOM(开源项目,直接为java编程服务);(4)JAXP(Java APIfor XML Processing)。本文将对这四种常用的XML解析技术进行简要介绍。同时本文也总结归纳了在应用系统中选择合适的XML解析技术的方法。 
   
  1 XML的解析技术 
   
  1,1 DOM解析技术 
  DOM(Document Object Model)是W3C发展的浏览XML文档的一种标准API,用与平台和语言无关的方式表示XML文档的标准,是一种基于树型的解析技术,将XML文档一次性解析。生成一个位于内存中的对象树用以描述该文档。也是以层次结构组织的节点或信息片断的集合,允许开发人员在XML树中寻找特定信息,通过加载整个文档和构造层次结构分析该结构,从而做任何工作。 
  100M定义了以下一系列的对象和方法对DOM树的节点进行各种随机操作: 
  (1)Document对象:作为树的最高节点,Document对象是对整个文档进行操作的入口。 
  (2)Elemem和Attr对象:这些节点对象都是文档某一部分的映射,节点的定级层次恰好反映了文档的结构。 
  (3)Text对象:作为Element和Attr对象的子节点,Text对象表达了元素或属性的文本内容。Text节点不再包含任何子节点。 
  (4)集合索引:DOM提供了几种集合索引方式,可以对节点按指定方式进行遍历。索引参数都是从0开始记数的。 
   
  1,2 SAX解析技术 
  SAX(Simple API For XML)是一个基于事件的XML文档解析标准,是采用“推”模式的解析模型,作为工业界的事实规范应用相当广泛。解析XML文档内容,就不得不对XSL(ExtensibleStylesheet Language)进行分析处理,因为XSL是XML的样式表语言,定义了XML的语法规范。另外,SAX以序列的形式处理文档,不需要在内存中建立整个文档的树结构,因此SAX对内存的要求通常会比较低,因为它让开发人员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时,SAX这种扩展能力得到了更好的体现,与DOM相比。其可认为其是一个轻量级的接口集合。但是其不是持久的,事件过后,若没保存数据,那么数据就丢了。 
   
  1,3 JDOM解析技术 
  JDOM的目的是成为Java特定文档模型,它简化了与XML的交互,从而减少DOM、SAX的编码量,极大减少了代码量。DOM适合于当今流行的各种语言。包括Java,JavaSeripte,VB,VBSeript,PeH,C,C++等,它也为HTML和XML文档提供了一个可应用于不同平台的编程接口。JDOM的另一个特点是它被设计成一个可以在小内存上
                 原创力文档
原创力文档 
                        

文档评论(0)