- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目录
第 1 章 问题描述
假设某文档只包含 26 个英文字母,应用哈夫曼算法对该文档进行压缩和解
压缩操作,使得该文档占用较少的存储空间。
一个较大的文件经过压缩后,产生了另外的一个较小容量的文件,我们就叫他是这些文
件较大容量的(可能一个或一个以上的文件)的压缩文件。而压缩此文件的过程称为文件压
缩。要使用这些经过压缩的文件,您就必须将这些经过压缩的文件还原成可以处理或执行的
文件格式。
目前网络上有两种常见的压缩格式:一种是zip ,另一种是EXE 。其中zip 的压缩文件
可以通过 Winzip 这套解压缩工具进行解压,而 EXE 文件内含解压缩程序,因此会比 zip 略
大一些。若想充分考虑到文件容量的大小,其实 zip 是一个较佳的选择。而我们这个程序则
可以将您选择的文件压缩成您需要的任意的格式。
第 2 章 基本要求
(1)假设文档内容从键盘输入;
(2 )设计哈夫曼算法的存储结构;
(3 )设计哈夫曼编码和解码算法;
(4 )分析时间复杂度和空间复杂度。
第 3 章 概要设计
3.1 数据结构的设计
对于给定的文档,首先通过扫描确定文档中出现了哪些英文字母以及出现的次数,以出
现的次数作为叶子结点的权值构造哈夫曼树,获得个字符的哈夫曼编码;然后在扫描一次文
档将其进行哈夫曼压缩编码,将文本文档换为二进制编码输出;最后将二进制流进行解码,
并与原文档进行对照,以验证算法的正确性。
图3-1 哈夫曼编码树
字 符 频 率 编 码
A 35 11
B 25 00
C 15 01
D 15 101
E 10 110
图3-2 字符编码
3.2 算法的设计
利用 Huffman 编码树求得最佳的编码方案。
根据哈夫曼算法,建立哈夫曼树时,可以将哈夫曼树定义为一个结构型的一维数组
HuffTree ,保存哈夫曼树中各结点的信息,每个结点包括:权值、左孩子、右孩子、双亲,
如图 6 所示。由于哈夫曼树中共有 2n-1 个结点,并且进行 n-1 次合并操作,所以该数组的
长度为 2n-1 。
weight lchild rchild parent
图3-1 哈夫曼树的结点结构
构造哈夫曼树的伪代码如下:
1. 数组 huffTree 初始化,所有元素结点的双亲、左右孩子都置为-1 ;
2. 数组 huffTree 的前n 个元素的权值置给定权值 w[n] ;
3. 进行 n-1 次合并
3.1 在二叉树集合中选取两个权值最小的根结点,其下标分别为 i1, i2 ;
3.2 将二叉树 i1、i2 合并为一棵新的二叉树 k ;
在哈夫曼树中,设左分支为 0 ,右分支为 1,从根结点出发,遍历整棵哈夫曼树,求得
各个叶子结点所表示字符的哈夫曼编码。
3.3 抽象数据类型的设计
ADT Tree
Data
树是由一个根结点和若干棵子树构成,树中结点具有相同数据类型及层次关系
Operation
InitTree
前置条件:树不存在
输入:无
功能:初始化一棵树
输出:无
后置条件:构造一棵树
DestroyTree
前置条件:树已存在
输入:无
功能:销毁一棵树
输出:无
后置条件:释放该树占用的存储空间
PreO
原创力文档


文档评论(0)