数据压缩原理.docx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据压缩原理

AIX 上总有一种压缩方式适合你当今世界每天产生大量的数据,有些数据我们需要进行压缩,压缩数据的好处不言而喻:节省空间;方便传输;加密保护等等。很多压缩工具应运而出,每种工具都有自己的特点。对于 AIX 平台上的压缩方法也很多 compress、pack、gzip、 pax、tar 等等。本文将首先简单介绍一下压缩的基本原理然后详细介绍 AIX 平台的常用压缩工具并针对它们各自的特色进行比较,让读者对对 AIX 平台的压缩有针对性的认识,从而能够根据不通的需要选择合适的压缩工具。数据压缩的原理数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。数据压缩包括有损压缩和无损压缩。无损压缩是可逆的;有损压缩是不可逆的。计算机处理信息是以二进制数(0 和 1)的形式表示的,压缩软件把二进制信息中相同的字符串以特殊字符标记起来,从而实现缩小文件大小来达到压缩的目的。压缩的理论基础是信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。数据压缩的硬件和软件工具也非常多,本文将针对 AIX 平台常见的几种数据压缩工具进行介绍和比较并提供常用的示例进行解说,希望您能从中选择合适的压缩工具进行压缩。AIX 平台上,通常我们看到的 .Z .gz .z .ar .tar 后缀的文件都是压缩文件。通过 compress 可以生成 .Z 压缩文件,通过 compress、uncompress、gzip 可以解压 .Z 格式的压缩文件;通过 gzip 可以生成 .gz 压缩文件,通过 gzip 可以解压 .gz 格式的压缩文件;通过 pack 可以生成 .z 压缩文件,通过 unpack、gzip 可以解压 .z 格式的压缩文件;通过 pax 可以生成 .ar 压缩文件,通过 pax 可以解压 .ar 格式的压缩文件;通过 pax、tar 可以生成 .tar 压缩文件,通过 pax、tar、untar、可以解压 .tar 格式的压缩文件。图 1 描述了各种类型文件的压缩及解压可以选择的 AIX 工具。图 1. 不同文件类型的压缩及解压下面我们将详细介绍 AIX 上主要压缩工具的特点已经用法。/developerworks/cn/aix/library/1012_yujing_aixcompress/回页首compresscompress 是一个相当古老的 UNIX 档案压缩指令,利用自适应的 Lempel-Zev 编码来减少文件大小。每一个被参数 File 指定的原文件将被可能的压缩文件所代替,压缩后的档案会加上一个 .Z。 延伸档名以区别未压缩的档案,压缩后的档案可以以 uncompress 解压。值得注意的是执行 compress 需要有相应的权限来替换文件。压缩量依赖于输入大小、由 Bits 变量指定的单位编码的比特数和公共子串的分布。典型地,源代码或英文文本将减少 50% 到 60%。特点如果调用压缩进程有适当的权限,压缩文件将保留与原文件相同的所有权、方式和修改时间。如果指定的文件的路径大于 1023 字节,该命令不工作。如果没有指定文件,标准输入将被压缩到标准输出。如果压缩没有减少文件大小,将对标准错误写一个消息而不替换原文件。compress 命令的压缩一般比利用哈夫曼编码或自适应哈夫曼编码实现的压缩更紧凑,计算时间更少,(哈夫曼编码在 pack 命令中被使用)。若要将数个档案压成一个压缩档,必须先将档案 tar 起来再压缩。常用示例$compress -v dsm.opt dsm.opt: Compression: 10.14% This file is replaced with dsm.opt.Z.该命令压缩 dsm.opt 文件,-v 参数将程式执行的讯息印在荧幕上。标准输出显示压缩百分比为 14 %。dsm.opt 文件被压缩并重命名为 dsm.opt.Z。$compress -b 12 dsm.old该命令指定文件中公共子串的比特的最大值为 12。-b 参数设定共同字串数的上限,以位元计算,可以设定的值为 9 至 16 bits 。由于值越大,能使用的共同字串就 越多,压缩比例就越大,所以一般使用预设值 16 bit。  $compress – df dsm.opt.该命令将 dsm.opt.Z 解压成 dsm.opt,若档案已经存在 -df 程式则会自动覆盖档案。由于系统会自动加入 .Z 为延伸档名,所以该命令中 dsm.opt.Z 写成 dsm.opt 也会当作 dsm.opt.Z

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档