数据压缩技术试卷.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据压缩技术试卷

数据压缩技术试卷 名词解释(3′×5) 压缩器(编码器):压缩输入流中的原始数据,建立由低冗余度数据构成的输出流的程序。 流(从压缩角度解释)文件:数据压缩处理中一般用“流”的概念来代替“文件”,因为压缩数据可直接传给解码器,无需成为文件再保存。 压缩比:输出流的大小/输入流的大小。 不可逆压缩:通过简单地舍弃一些信息来“压缩”原始数据,有时是可以接受的,这叫做不可逆压缩。 算法信息容量:把某个二进制字符串Sin的复杂度定义为能生成S(如显示、打印或写进文件中)的最短的计算机程序的长度。 编码(10′×2) 已知一个文本符号种类为7种,第1符号出现的概率为0.25,其余依次为0.20,0.15,0.15,0.10,0.10,0.05。试用香农-费诺编码方式进行编码,并计算平均码长。 解:1 0.25 1 1 :11 2 0.20 1 0 :10 3 0.15 0 1 1 :011 4 0.15 0 1 0 :010 5 0.10 0 0 1 :001 6 0.10 0 0 0 1 :0001 7 0.05 0 0 0 0 :0000 平均长度=0.25×2+0.20×2+0.15×3+0.15×3+0.10×3+0.10×4+0.05×4 =2.7位/字符 已知一个文本符号种类为5种,第1个符号出现的概率为0.4,其余依次为0.2,0.2,0.1,0.1。试用霍夫曼编码方式进行编码,并计算平均码长。 解:1 0.4 :01 2 0.2 :10 3 0.2 :111 4 0.1 :1101 5 0.1 :1100 平均长度=0.4×1+0.2×2+0.2×3+0.1×4+0.1×4=2.2位/字符 问答题(15′×2) 为什么说任何压缩方法都有局限性? 答:任何压缩方法都有局限性,它不能无失真地压缩所有长度为N的文件,因为这些文件中有些是随机的。假定存在一种算法,能无失真的压缩所有N位长的文件,长为N的文件共有2N个,用该算法压缩必须得到2N个短于N的文件。那么有多少个短于N的文件呢?答案是长度为N-1的文件有2N-1个,为N-2的有2N-2个,等等。一直到长度为N-N=0的文件有2N-N=1个,这些文件的总数为: 2N-1+2N-2+…+1=2N-1 不是2N:因此至少有两个长度为N的不同文件被压缩成较短的相同文件,这意味着该算法有失真。 什么叫熵?熵的计算公式是什么?计算结果能说明什么问题? 答:用概率表示的信息量叫做熵(Entropy)。熵的计算公式为: 从平均意义上来说,“熵”表示一个符号所需的最少位数。 问答题(10′×2) 试述LZ77基本工作原理。 答:LZ77是由Jacob Ziv和Abraham Lempel在20世纪70年代最早提出的滑动窗式的字符串压缩方法。其基本思想是:把已输入数据流的一部分作为字典,编码器为输入流开一个窗口,并随着字符串的编码而把窗口中数据从右移到左。因而这是一种基于滑动窗口的方法。 试述自适用(即动态)霍夫曼编码方式的工作原理。 答:压缩器从一棵空的霍夫曼树开始工作,对任何符号都没有分配码字。它把输入的第一个符号不经压缩地直接写进输出流,然后把它添加到树中,赋予码字。下次再见到这个码字时,就把字的当前码字写进输出流,并将其出现频率加1。解压器镜像对应压缩器的相同步骤。 问答题(15′) 设计一个标志符的RLE文本压缩系统(要求给出压缩、解压流程图,进行工作原理说明,画出界面结构等,并思考实用压缩器的结构及工作原理)。 解:RLE文本压缩算法:设C为字符数目记数单元,设R为重复记数单元,CH为当前字符有效单元,SC为比较或匹配字符存放单元。 RLE文本解压缩算法流程: 0 1 1 1 1 0 0 0 1.0 0.6 0.4 0.2 置压缩标志 R ←0, SC ← CH 在压缩文件中写压缩 格式内容(占3个字节) N Y Y R ←R+1 SC ← CH 按R值将SC中字 符写入压缩文件 Y R4? N C=1? SC=CH?H? 是文本结束符号否? N C ←C+1 从文本缓冲区顺序读1个字符到CH单元 C←0,R ←0 N 结束 Y Y 输出字符 读入N,输出N个N后相同的字符 Char=’@’? N Y 压缩标志清除否? N 结束 Y 是文本结束符号否? 顺序读文本字符

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档