- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
页码,1/ 11
调查最先进的 XML 压缩技术
查识别 (或不识别) XML 且您可以查询 (或不查询)的数据压缩器
简介:XML 认为是数据表示和通过万维网交换数据的标准。XML 拥有极大的灵活性并获得了广泛认可,但它
有一个缺点,即 XML 文档较大。这种尺寸意味您传输、处理、存储和查询的信息量通常大于其他数据格式。您
可以从多个 XML 压缩技术进行选择来处理这些问题。本文提供了对最先进的 XML 压缩技术的概述。
标记本文!
发布日期:2011 年 9 05 日
级别: 中级
原创语言:英文
简介
常用缩略语
l CDATA :字符数据
l DTD :文档类型定义
l GPS:全球定位系统
l HTML:超文本标记语言
l PPM:根据部分匹配预测
l SAX :XML 的简易 AP I
l W3C:万维网联盟
l XML:可扩展标记语言
XML 是因为 HTML 和万维网的广泛普及而出现的最有用、最重要的技术之一。XML 解决了许多问题,因为它可
以在不同的架构之间提供中立的数据表示,通过最少的努力弥补软件系统之间的差距,并存储大量的半结构化数
据。
XML 通常 称为自我描述的数据,因为它 设计为对文档中的每个记录使用重复的模式。这种自我描述功能为
XML 提供了巨大的灵活性,但是也引入了 XML 文档过于冗长的问题,这会造成文档较大。由于 XML 的使用率
在不断增长,而且大型 XML 文档信息库目前也 常普遍,所以对高效 XML 压缩工具的需求 常大。
图 1 说明了使用 XML 压缩器减少通过网络传输 XML 数据的成本这一优势。为了解决大型 XML 文档的大小问
题,许多 XML 感知的压缩器利用众所周知的 XML 文档的结构,使得压缩比率优于一般的文本压缩器的比率。
XML 压缩工具的众多优势包括减少数据交换所需的网络带宽,减少存储所需的磁盘空间,并最大限度地降低了
处理和查询 XML 文档的主要内存要求。
图 1. 使用 XML 压缩器通过网络传输 XML 数据的优势示例
页码,2/ 11
从原则上说,XML 压缩器可以根据两个主要特点进行分类。图 2 说明了第一种分类,这种分类基于对 XML 文
档结构的感知。根据这种分类,压缩器可分为两大类:
l 一般的文本压缩器。由于 XML 数据是以文本文件的形式进行存储的,因此压缩 XML 文档的第一种逻
辑方法是采用传统的通用文本压缩工具 (例如:gzip、bzip2)。这种 XML 压缩器是与 XML 无关的,
也就是说,它们将 XML 文档用作普通的纯文本文件,因此采用的是传统的文本压缩技术。
l XML 感知压缩器。这种压缩器旨在利用对 XML 文档结构的感知,实现比一般文本压缩器更好的压缩比
率。这组压缩器可以根据压缩器对如下所示的 XML 文档的模式信息可用性的依赖性进行进一步分类:
¡ 依赖模式的压缩器。编码器和解码器都必须能够访问文档模式信息,以实现压缩流程 (如:
rngzip)。
¡ 独立于模式的压缩器。不要求模式信息的可用性便可实现编码和解码流程 (如:XMill、
SCMPPM)。
图 2. 根据其对 XML 文档结构的感知对 XML 压缩器进行的分类
图 3 说明了对 XML 压缩器进行的第二种分类,基于压缩器支持以下查询的能力:
页码,3/ 11
l 非可查询 (归档)XML 压缩器。这种 XML 压缩器不允许通过 压缩的格式 (例如:gzip、bzip2、
XMill)处理查询。这类压缩器主要侧重于实现最高的压缩比。在默认情况下,通用文本压缩器是 可查
询压缩器组。
l 可查询 XML 压缩器。这种 XML 压缩器允许通过其 压缩的格式处理查询。这种压缩器的压缩比通常
比归档 XML 压缩器的压缩比差。这类压缩器主要侧重于避免在查询过程中进行完整
您可能关注的文档
最近下载
- 22J403-1 楼梯 栏杆 栏板(一) (3).pdf VIP
- 口腔科门诊护士接诊流程ppt新版【16页】.pptx VIP
- 课件:土壤有机质的测定.ppt VIP
- 2025年蜀道投资集团有限责任公司招聘笔试备考试题及答案解析.docx VIP
- 材料与试验协会 E 3-2001金相试样的制备方法(中文版).pdf VIP
- 设备台账标准格式.xls VIP
- 动火作业施工方案模板.docx
- 玩家国度ROG STRIX Z790-E GAMING WIFI 主板 ROG STRIX Z790-E GAMING WIFI 简体中文版使用手册.pdf
- 2025年蜀道投资集团有限责任公司招聘笔试备考题库及一套答案详解.docx
- 2025年辅警招考时事政治考题及答案.docx VIP
文档评论(0)