22 第二十二章使用Java解析XML.docVIP

下载本文档

2
0
约2.17万字
约 27页
2017-06-16 发布于河南
举报
版权申诉

22 第二十二章使用Java解析XML.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

22 第二十二章使用Java解析XML

第二十二章：XML 学习目标解析器的介绍文档对象模型（DOM）解析实例 SAX解析实例 JAVA操纵XML 实例讲解解析器的介绍 XML解析器是读取XML文档并分析其结构的代码。这一部分将介绍XML解析器是如何工作的。将讨论不同类型的XML解析器及何时使用它。一般而言使用解析器需要以下步骤：创建一个解析器对象使解析器指向您的XML文档处理结果显然第三步最为复杂。一旦知道了XML文档的内容，比方说，您可能希望生成一个Web页面，创建一个订单或者做一个饼图。这里讨论的常见XML解析工具使这项工作大大简化。解析器有不同的分类方法：验证和非验证解析器支持一种或多种XML Schema语言的解析器支持Document Object Model (DOM)的解析器支持Simple API for XML (SAX)的解析器我们已知有三种不同类型的XML文档：结构良好的文档：这类文档符合XML基本规则（属性必须放在引号中，标签必须正确套等）。有效文档：这些结构良好的文档同时还符合文档类型定义（DTD）或XML Schema所定义的规则。无效文档：所有其他文档。如果您有一个XML文档符合XML的基本规则，那么它就是一个结构良好的文档。如果该文档还满足您的公司所定义的支出帐目文档规则，那么它也是有效的。如果XML解析器发现XML文档不是结构良好的，XML Specification要求解析器报告一个致命错误。验证解析器：在解析时验证XML文档，而非验证解析器：不验证文档。换句话说，如果一个XML文档是结构良好的，那么非验证解析器并不关心文档是否符合DTD或模式中定义的规则，甚至不关心该文档是否符合DTD或模式中定义的规则，甚至不关心该文档是否有这样的规则。（多数验证解析器都默认关闭验证功能。）那么为什么要使用非验证解析器呢？有两个很好的理由：速度和效率。XML解析器读取DTD或者模式，建立规则引擎保证XML文档中的每个元素和属性都遵循这些规则，需要做大量的工作。如果您确信一个XML文档是有效的，那么就可以完全跳过验证。根据文档规则复杂程度的不同，这样可以节约相当可观的时间和内存。如果您的代码不够健壮，它从XML文档中得到输入数据，并且该代码要求文档遵循特定的DTD或者模式，那么您可能就不得不验证所有的内容，不论代价多么高，多么浪费时间。 DOM是W3C推荐正式标准。它定义了一个接口，程序能够访问和更新XML文档的结构。如果一个XML解析器声称支持DOM，就意味着它实现了该标准中定义的接口。目前，有三个级别的DOM是正式的推荐标准，被命名为DOM Level 1,DOM Level 2 和DOM Level 3。本章中所讨论的DOM功能都是DOM Level 2的一部分。 DOM解析器：当你使用DOM解析器解析一个XML文档时，您得到一棵结构树，它表示XML文档的内容。所有的文本，元素和属性，都在这个树结构中解析的过程解析后的XML文档。 DOM还提供各种不同的功能，可用于分析和操作树的内容和结构。DOM是处理XML数据的传统方法。使用DOM时，数据以树状结构的形式被加载到内存中所以，DOM解析是一个比较耗费内存的操作。如所示，矩形框表示元素节点，椭圆表示文本节点。DOM使用父子关系。例如，在这个例子中，student是具有五个孩子的根元素：三个文本节点（空白），以及两个元素节点name和age。要认识到的一件重要事情是，name 和 age节点实际上具有null值。相反，它们具有文本节点（goudan 和 28）作为孩子。DOM以及广义的基于树的处理具有几个优点首先，由于树在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航，而不是像SAX那样是一次性的处理。DOM使用起来也要简单得多。另一方面，在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外，创建一棵DOM树可能是一个缓慢的过程。为了满足该缺点，我们使用SAX（Simple API for XML）API处理XML文档内容。它的设计目标是占用更少的内存，把更多的工作交给程序员。SAX和DOM是互补的，有各自的适用环境。请看下图解析过程：当使用SAX解析器解析一个XML文档时，解析器在读取文档的过程中会生成一系列的事件。至于如何处理这些事件则取决于您。下面列出了一小部分您在XML文档时可能遇到的事件： startDocument事件对于每个元素，在元素开始时有startElement事件，元素结束时有endElement事件如果元素包含内容，对于文本将出现characters事件，对于子元素将出现startElement和endElement事件，

您可能关注的文档

文档评论（0）

jgx3536 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6111134150000003

1亿VIP精品文档

更多 >

22 第二十二章使用Java解析XML.docVIP