在OracleXMLDB11g中管理复杂的XML数据.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在 Oracle XML DB 11g 中管理复杂的 XML 数据 作者:V.J. Jain 了解如何使用 Oracle XML DB 11g 管理复杂的 XML,包括如何联机更改模式 2007 年 12 月发布 在过去几年里,XML 已经成为数据传输的新标准,随着企业不断采用基于 XML 的解决方案,其应用也越来越普遍。随着更多组织对所有数据传输执行 XML 标准,日益复杂的 XML 格式不断出现。这些复杂的格式可以包括多个命名空间、数千个元素和递归定义。随着这些格式所生成的 XML 文档的大小和复杂性的不断增加,管理这些内容变得越来越具有挑战性,而有关应对这些挑战的信息却极为有限。 在本文中,您将了解如何使用 Oracle 数据库 11g 中的 XML DB 特性管理复杂的 XML 内容,以及与商用 ETL 产品相比它所具有的优势。您将看到一个用于演示下述内容的复杂 XML 模式的示例: 注册复杂的 XML 模式 将 XML 文件插入到数据库中 通过关系查询检索 XML 数据 XML 模式修改的原地演变 此外,您还可以大致了解使得 Oracle XML DB 解决方案的性能和吞吐量最大化的策略以及复杂 XML 格式的实际应用。 Oracle XML DB 的背景 Oracle XML DB 是 Oracle 数据库的一个特性,它提供了一个用于管理 XML 内容的强大工具,包括存储、操作和检索。它提供不同的存储选项,以满足不同 XML 格式的独特要求。这些选项包括非结构化、二进制和结构化存储: 非结构化(字符大对象,即 CLOB)。通过将文档作为一个大对象并将其插入到数据库中,此方法可获得最佳插入次数。然而,对于数据的关系访问而言,此存储方法消耗的空间最大且性能最差。如果需要采用关系访问,这不是一个管理大型复杂 XML 文档的实用解决方案。如果磁盘空间不是问题且目标以文档的原始格式对其进行存储,非结构化存储是一个实用的解决方案。 二进制存储。 这是 Oracle 数据库 11g 中的一个新增选项,以专门针对 XML 数据设计的分析后的二进制格式来存储数据。该选项与非结构化存储相比有许多优势,它可以感知 XML 模式,从而可以获得更高的磁盘空间效率和查询性能。尽管该选项可以提供非结构化存储无法比拟的性能,但它的查询性能却逊色于结构化存储。只要可以接受二进制存储在关系访问时的性能,它就是一个很好的选项。由于该存储选项易于使用,因此在选择结构化存储前值得对其进行评价。 结构化存储。 也称作基于模式的存储,该选项使用对象关系模型在数据库中存储 XML 文档。此存储选项在磁盘空间和关系访问方面效率最高。它在文件插入时的开销也是最高的,要求为模式注册进行额外的准备。在要求最佳关系访问时,结构化存储是最佳选项。在处理复杂的大文件并要求高效的关系访问时,该存储选项通常是最好的选择。 不同组织对 XML 文档的大小和复杂性的看法可能迥然不同。一方面,对于使用 XML 进行电子数据交换 (EDI) 或其他事务数据交换的联机事务处理 (OLTP) 数据库而言,具有有数千行的文件会被视为一个非常大的文件。另一方面,一个多 TB 的数据仓库可能经常处理以 GB 计的 XML 文档,因此只将包含数百万行的文件看作大文件。对于 XML 文档复杂性的看法,这一概念同样适用。 就本文而言,具有以下属性的文档被看作是一个“复杂”文档: 具有单根节点和多个命名空间的文档。 具有灵活的 XML 定义、在维持有效性的同时允许较大变化的文档。 具有递归或循环引用的文档。 具有非静态 XML 模式的文档。 在本文中,如果 XML 文档是单根节点且大于 20MB,就被看作“大型文档”。这些属性介绍了一个强健的企业解决方案所必须解决的可伸缩性和管理问题。 在最佳存储选项的选择上,没有什么金科玉律。最佳选项将随文件结构、性能目标、可用资源和预期数据量的变化而变化。如果您无法确定哪个存储选项最符合您的特定需求,不妨试试不同的格式再确定最符合您特定需求的最佳选项。一般而言,如果您要处理大型文档并且需要进行关系访问,非结构化存储从性能或资源角度是不可接受的。如果查询性能可以为业务使用所接受或者业务需要维护时间最短的选项,二进制 XML 可能是最佳解决方案。然而,如果关系访问是主要目标,并且用户需要快速访问 XML 文档中包含的任何数据,结构化存储最有可能是最佳选项。 使用结构化存储使吞吐量达到最大 虽然使用结构化存储选项时存在因插入文件所导致的开销成本,但是您可以通过将大文档分解成多个小文档来减少这一开销。例如,如果有一个 700MB 的单根节点的 XML 文件,可以将它分解为 10 个 XML 模式有效的小文件。插入 10 个不同的 70

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档