实验2 Huffman编码对英文文本的压缩和解压缩..docVIP

下载本文档

48
0
约2.07万字
约 24页
2019-02-18 发布于湖北
举报
版权申诉

实验2 Huffman编码对英文文本的压缩和解压缩..doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《信息论与编码》实验报告班级：学号：姓名：完成时间：2011年实验2 Huffman编码对英文文本的压缩和解压缩一、实验内容根据信源压缩编码——Huffman编码的原理，制作对英文文本进行压缩和解压缩的软件。要求软件有简单的用户界面，软件能够对运行的状态生成报告，分别是：字符频率统计报告、编码报告、压缩程度信息报告、码表存储空间报告。二、实验环境计算机 Windows 2000 或以上 Microsoft Office 2000 或以上 VC++ 6.0 MSDN 6.0 三、实验目的掌握Huffman编码的原理掌握VC开发环境的使用（尤其是程序调试技巧）掌握C语言编程（尤其是位运算和文件的操作）掌握数据结构的内容：链表、顺序表、堆栈、最优二叉树掌握结构化程序分析和开发的软件工程原理四、实验要求提前预习实验，认真阅读实验原理。认真高效的完成实验，实验过程中服从实验室管理人员以及实验指导老师的管理。认真填写实验报告。要求有实验问题、实验原理、Matlab的源程序以及实验结果（实验内容中）。每个同学必须独立完成实验（不能抄袭，否则两人均为零分），实验成绩是该门课程成绩的主要依据。五、实验原理压缩/解压缩流程压缩流程：读取扫描文本文件——〉统计字符频率——〉生成码字——〉保存压缩文件解压缩流程：读取扫描压缩文件——〉提取字符频率——〉生成码树——〉保存文本文件 Huffman编码算法（略）文件操作和位运算（略）六、Huffman 算法的8种不同实现方式 1. huffman_a 使用链表结构生成Huffman树的算法，这是最基本的实现方法，效率最低。 2. huffman_b 使用《数据结构》（严蔚敏，吴伟民，1997，C语言版）中给出的算法，将二叉树存放在连续空间里（静态链表），空间的每个结点内仍有左子树、右子树、双亲等指针。 3. huffman_c 使用Canonical Huffman编码，同时对huffman_b的存储结构进行改造，将二叉树存放在连续空间tree里，空间的每个结点类型都和结点权值的数据类型相同，空间大小为2*num，tree[0]未用，tree[1..num]是每个元素的权值，生成Huffman后，tree[1..2*num-1]中是双亲结点索引。 4. huffman_d 在huffman_c的基础上，增加预先排序的功能先用QuickSort算法对所有元素的权值从小到大排序，这样，排序后最前面的两个元素就是最小的一对元素了。我们可以直接将它们挑出来，组合成一个子树。然后再子树的权值用折半插入法插到已排序的元素表中，保证所有结点有序。为了保证初始元素的顺序不变，我们另外使用了一个索引数组，所有排序中的交换操作都是在索引数组中进行的。 5. huffman_e 在huffman_d的基础上，将索引数组放在tree的内部。为编码方便，将元素权值放在tree[num..2*num-1]处。将tree[0..num-1]作为索引数组。排序改为从大到小。对索引数组排序后，每次从最后选出2个最小值，相加后的结点权值放在索引数组最后，结点索引放在索引数组中倒数第2个位置，然后索引数组大小减1，并将最后一个索引值插入到前面的有序表中，保证索引数组仍然有序。 6. huffman_f 在huffman_e的基础上，将排序改为利用堆排序原理选择最小的两个权值。也即，将所有元素的权值组织成堆后，每次堆内的根结点就是最小值了。每取出一个根结点后，就把堆尾元素调到根结点重建堆。取出两个最小值合并成一个子树后，再把子树作为叶子结点放到堆中，并让其上升到合适的位置，保持堆性质不变。因为每次不必完成整个排序过程，而只是组织成堆，因此，这种方法要比使用快速排序更快。上述算法参考了mg-1.2.1中Huffman编码的实现，见http://www.cs.mu.oz.au/mg/ 7. huffman_g 当元素权值已经有序时，可以使用A. Moffat和J. Katajainen设计的在权值数组内部构建Huffman的方法。A. Moffat和J. Katajainen对该算法的描述见http://www.cs.mu.oz.au/~alistair/abstracts/inplace.html 8. huffman_h 在huffman_f的基础上，增加限制码长的功能。限制码长的算法参考了zlib-1.1.4中构造限制码长的Huffman编码的源代码。zlib的源代码见/zlib/，其中限制长度的算法在tree.c的gen_bitlen()函数中。七．Huffman 的java 实现：界面类 public class ComFileFrame { publi