第二章-计算机信息表示与存储-2016资料.pptVIP

第二章-计算机信息表示与存储-2016资料.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章-计算机信息表示与存储-2016资料

* 带符号数高位表正负 * * * * * * * * * * * * * * * * * * * * * * * 2.5 数据压缩 为何要进行数据压缩 存储文件需要消耗很大的空间,增加了硬件成本 传输这些文件也需要较大的带宽 为何可以压缩数据 信息本身存在冗余 信息的编码方式存在冗余 数据压缩的本质就是对数据进行再次编码的过程。数据压缩的目标是在保持信息基本不变的前提下,减小信息的存储空间。 衡量压缩编码效果的主要指标——压缩比 压缩编码的分类 无损压缩编码(Lossless compression coding) 压缩时不丢失任何信息量,解压缩后可以完全地恢复原来的信息。也称为可逆压缩。对于可执行程序的压缩方法必须是无损压缩。对于重要的数据文件、文本文件的压缩,也必须使用无损压缩。 WinRAR、WinZip采用的就是无损压缩算法。无损压缩一般的压缩比在2:1到5:1,压缩率较小。 有损压缩编码(Loss compression coding) 压缩时多少会丢失一些信息量。解压缩后的内容和原始的内容会有一定差别,但仍然是完全可以接受的,不会影响数据的正常使用。有损压缩也称不可逆压缩。 有损压缩主要用于音频、图像、视频文件的压缩。压缩比比较大,一般可以达到压缩比等于10,或者更大。 压缩编码算法——行程长度编码 行程长度编码(Run Length Encoding)也称为游程长度编码 行程(Run)是指数据中重复连续出现的字符。 该编码算法就是要发现这些重复连续出现的字符,统计重复出现的次数,并把这些重复出现的字符,用“出现次数+字符”来进行编码 如果字符重复出现的次数小于3次,一般就不进行行程长度编码,而是直接使用重复出现的字符。 例 “AAAABBBAABBBBBCCCCCCCCDABCBAAABBBBCCCD”,经过行程长度编码后就是:“4A3BAA5B8CDABCB3A4B3CD”。 原有的数据量是38个字节(一个字符占用一个字节),压缩编码后的数据量是22个字节(一个数字也占一个字节)。压缩比约为1.72。 行程长度编码实例 若采用行程长度编码,对于图中第1排到第4排的编码如下: 图中第1排(第1行~第4行) :10白,1黑,13白 图中第2排(第5行~第8行) :10白,3黑,11白 图中第3排(第9行~第12行):10白,2黑,6白,2黑,4白 图中第4排(第13行~第16行):2白,19黑,3白 若每个数字用1字节编码,一种颜色也用1字节编码。这16行编码后的数据量是: 6×4+6×4+10×4+6×4 = 112字节 如果不采用压缩编码,这16行数据总共是: 96 X 16 / 8 = 192字节 压缩比是192/112 = 1.71 上图是96×96的字符点阵,(图中的每个小格都是4bit*4bit)直接存储这个点阵需要1152个字节。 压缩编码算法——不等长编码 等长编码——对于每一个单位数据,都用相同长度的二进制代码来进行编码。 例如ASCII码,就是对每一个字符都采用7位代码编码的等长编码 不等长编码的思想:减少使用概率大的字符的编码长度,增加使用概率小的字符的编码长度,从而减少编码后的总数据量,也就是实现了压缩编码 不等长编码实例 字符?? a???? b???? c???? d????? e????? f 频度(单位:千次) 45??? 13??? 12??? 16???? 9????? 5 定长编码??? 000?? 001?? 010?? 011??? 100??? 101 变长编码??? 0??? 101?? 100?? 111??? 1101?? 1100 如果采用等长编码,100000个字符需要的空间是 300000bit 若采用不等长编码,100000个字符需要的空间是: (45×1+13×3+12×3+16×3+9×4+5×4)×1000 = 224000 bit 采用不等长编码的数据量约减少了25%。 压缩编码算法——替换编码 替换编码就是将原始数据中的一些符号串,用更简单的符号来替换的一种编码方法。可以用于文本文件的压缩,也可以用于图形文件的压缩。 对于文本文件来说,“符号串”就是“字符串”。就是将在文本中经常出现的字符串用更简单的串来替换。最简单的就是用单个字符替换经常出现的字符串。 替换编码有许多不同的做法。 有一种自适应的替换编码可以根据原有的数据自动的产生符号串替换表。在实际中有较广泛的应用。 替换编码实例 例:以下一段文本总共是255个字符(包括空格) To begin, let’s look at a simple program that computes the area of a

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档