- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于DOMXML解析在JAVA中技术实现及应用
基于DOMXML解析在JAVA中技术实现及应用
摘要:用Java解析XML文档,可以使用DOM解析器,DOM 是用与平台和语言无关的方式表示 XML 文档的官方 W3C 标准。DOM 是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构。
关键词:W3C DOM XML JAVA
XML是 Extensible Markup Language的缩写, 意为可扩展标记语言,具有可扩展性, 灵活性, 自描述性 , 简明性等诸多先进特性, XML支持世界上几乎所有的主要语言,并且不同语言的文本可以在同一文档中混合使用,应用XML的软件能处理这些语言的任何组合。XML能很好、方便地描述和组织数据,在很多实际问题中,人们非常关心XML的数据结构,并根据其结构提取自己需要的数据。XML解析器是XML和应用程序之间的一个软件组织,为应用程序从XML文件中解析出所需要的数据。
一、DOM概述
DOM是Document Object Model的英文缩写,即文档对象模型,是W3C制定的一套规范标准,规定了解析文件的接口,它把HTML文档、XML文档等看成一个文档对象,在接口里面存放的是对这些文档操作的属性和方法的定义,若编程语言实现了这些属性和方法,就可以对文档对象中的数据进行存取,并且利用程序对数据进行进一步的处理。
二、基于DOM的XML解析
解析器是一个软件应用程序,设计用于分析文档,以及做一些特定于该信息的事情。解析器主要有两种:基于DOM的解析器和基于事件的解析器SAX。这里主要阐述DOM解析器。
W3C DOM提供了一组标准界面用来描述XML文件的标准对象和访问、操作这类文件。若以面向对象的思维来看,可以把XML文档看成是一个对象,一个XML文档对象又可以包含其他的对象,如节点对象。对XML文档对象的操作实际是对该对象的节点对象的操作,即可以对节点对象进行修改等操作。在用DOM对XML文档进行处理的时候,可以把一个XML文档看成一个源树,根元素对应相应的根节点,子元素对应相应的子节点。DOM解析器首先把该XML文档加载到内存中去,在内存中,XML文档的逻辑形式以树的结构存在,利用程序对XML文档的操作都是建立在树的结构形式上的。
三、DOM内部结构
DOM文档中的逻辑结构可以用节点树的形式进行表述。通过对XML文件的解析处理,XML文件中的元素便转化为DOM文档中的节点对象。
DOM主要的文档节点有Document、Node、NamedNodeMap、NodeList这几种类型。Document是对文档进行操作的入口,它是从Node继承过来的,每一个DOM文档必须有一个Document节点,并且为节点树的根节点。它可以有子节点,或者叶子节点如Text节点、Comment节点等。Node是其它大多数接口的父类,Documet、Element、Attribute、Text、Comment等都是从Node继承过来。NodeList是节点的集合,它包含了某个节点中的所有子节点。NamedNodeMap也是节点的集合,通过它可以建立节点名和节点之间的一一映射关系,从而利用节点名可以直接访问特定的节点。
除此之外,常用的还有Element、Text、CDATASection、Attr等节点。任何的格式良好的XML文件中的每一个元素均有DOM文档中的一个节点类型与之对应。利用DOM接口将XML文件转化成DOM文档后,我们就可以自由的处理XML文件了。
四、JAVA中的DOM接口
Sun公司提供了Java API for XML Parsing(JAXP)接口来使用DOM,JAXP实现了DOM规范的JAVA语言绑定,给出了DOM规范指定的接口,并给出实现这些接口的类集合。
JAXP接口包含了三个包:
(1)org.w3c.domW3C推荐的用于XML标准规划文档对象模型的接口。
(2)org.xml.sax 用于对XML进行语法分析的事件驱动的XML简单API
(3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
Sun公司推出的jdk1.5版中的java API遵循了 DOM level 2 Core推荐接口的语义说明,提供了相应的java语言的实现。
在org.xml.dom中,jkd1.5提供了Document、DocumentType、Node、NodeList、Element、Text等接口,这些接口均是访问DOM文档所必须的。我们可以利用
文档评论(0)