调查最先进 XML 压缩技术.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
页码,1/ 11 调查最先进的 XML 压缩技术 查识别 (或不识别) XML 且您可以查询 (或不查询)的数据压缩器 简介:XML 认为是数据表示和通过万维网交换数据的标准。XML 拥有极大的灵活性并获得了广泛认可,但它 有一个缺点,即 XML 文档较大。这种尺寸意味您传输、处理、存储和查询的信息量通常大于其他数据格式。您 可以从多个 XML 压缩技术进行选择来处理这些问题。本文提供了对最先进的 XML 压缩技术的概述。 标记本文! 发布日期:2011 年 9 05 日 级别: 中级 原创语言:英文 简介 常用缩略语 l CDATA :字符数据 l DTD :文档类型定义 l GPS:全球定位系统 l HTML:超文本标记语言 l PPM:根据部分匹配预测 l SAX :XML 的简易 AP I l W3C:万维网联盟 l XML:可扩展标记语言 XML 是因为 HTML 和万维网的广泛普及而出现的最有用、最重要的技术之一。XML 解决了许多问题,因为它可 以在不同的架构之间提供中立的数据表示,通过最少的努力弥补软件系统之间的差距,并存储大量的半结构化数 据。 XML 通常 称为自我描述的数据,因为它 设计为对文档中的每个记录使用重复的模式。这种自我描述功能为 XML 提供了巨大的灵活性,但是也引入了 XML 文档过于冗长的问题,这会造成文档较大。由于 XML 的使用率 在不断增长,而且大型 XML 文档信息库目前也 常普遍,所以对高效 XML 压缩工具的需求 常大。 图 1 说明了使用 XML 压缩器减少通过网络传输 XML 数据的成本这一优势。为了解决大型 XML 文档的大小问 题,许多 XML 感知的压缩器利用众所周知的 XML 文档的结构,使得压缩比率优于一般的文本压缩器的比率。 XML 压缩工具的众多优势包括减少数据交换所需的网络带宽,减少存储所需的磁盘空间,并最大限度地降低了 处理和查询 XML 文档的主要内存要求。 图 1. 使用 XML 压缩器通过网络传输 XML 数据的优势示例 页码,2/ 11 从原则上说,XML 压缩器可以根据两个主要特点进行分类。图 2 说明了第一种分类,这种分类基于对 XML 文 档结构的感知。根据这种分类,压缩器可分为两大类: l 一般的文本压缩器。由于 XML 数据是以文本文件的形式进行存储的,因此压缩 XML 文档的第一种逻 辑方法是采用传统的通用文本压缩工具 (例如:gzip、bzip2)。这种 XML 压缩器是与 XML 无关的, 也就是说,它们将 XML 文档用作普通的纯文本文件,因此采用的是传统的文本压缩技术。 l XML 感知压缩器。这种压缩器旨在利用对 XML 文档结构的感知,实现比一般文本压缩器更好的压缩比 率。这组压缩器可以根据压缩器对如下所示的 XML 文档的模式信息可用性的依赖性进行进一步分类: ¡ 依赖模式的压缩器。编码器和解码器都必须能够访问文档模式信息,以实现压缩流程 (如: rngzip)。 ¡ 独立于模式的压缩器。不要求模式信息的可用性便可实现编码和解码流程 (如:XMill、 SCMPPM)。 图 2. 根据其对 XML 文档结构的感知对 XML 压缩器进行的分类 图 3 说明了对 XML 压缩器进行的第二种分类,基于压缩器支持以下查询的能力: 页码,3/ 11 l 非可查询 (归档)XML 压缩器。这种 XML 压缩器不允许通过 压缩的格式 (例如:gzip、bzip2、 XMill)处理查询。这类压缩器主要侧重于实现最高的压缩比。在默认情况下,通用文本压缩器是 可查 询压缩器组。 l 可查询 XML 压缩器。这种 XML 压缩器允许通过其 压缩的格式处理查询。这种压缩器的压缩比通常 比归档 XML 压缩器的压缩比差。这类压缩器主要侧重于避免在查询过程中进行完整

文档评论(0)

wpxuang12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档