- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华北科技学院_《数据结构》_哈夫曼压缩_实验报告
华北科技学院计算机系综合性实验
实 验 报 告
课程名称 数据结构实验
实验学期 2011 至 2012 学年 第 一 学期
学生所在系部 计算机学院
年级 专业班级
学生姓名 学号
任课教师 鞠宏军
实验成绩
计算机系制实验报告须知学生实验报告,页面空间不够,。学生应该填写的内容包括:封面相关栏目、地点、时间、结果分析。教师应该填写的内容包括:实验教师根据课程的实验要求,评定学生的实验成绩未尽事宜,请参考该课程实验大纲和大纲。
实验题目:
用哈夫曼编码实现文件压缩。
二、实验目的:
1、了解文件的概念。
2、掌握线性链表的插入、删除等算法。
3、掌握Huffman树的概念及构造方法。
4、掌握二叉树的存储结构及遍历算法。
5、利用Huffman树及Huffman编码,掌握实现文件压缩的一般原理。
三、实验设备与环境:
微型计算机、Windows 系列操作系统 、Visual C++6.0软件
四、实验内容:
根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。
五、概要设计详细设计—Hufffman算法
构造Huffman树步骤:
根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,令起权值为wj。
在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。
在森林中删除这两棵树,同时将新得到的二叉树加入森林中。
重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。
(2)Huffman编码:数据通信用的二进制编码
思想:根据字符出现频率编码,使电文总长最短
编码:根据字符出现频率构造Huffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列。
(3)二叉树的存储结构
typedef struct node
{
datatype data;
struct node *lchild, *rchild;
}BinTree;
压缩过程的实现的流程图如下:
压缩过程的实现:
(1)分为:①创建Haffman树(②打开需压缩文件(③将需压缩文件中的每个ascii码对应的haffman编码按bit单位输出(④文件压缩结束。
(2其中,步骤①和步骤③是压缩过程的关键。
步骤1:这里所要做工作是得到Haffman数中各叶子结点字符出现的频率并进行创建。
统计字符出现的频率可以有很多方法:如每次创建前扫描被创建的文件,“实时”的生成各字符的出现频率;或者是创建前即做好统计。本文采用后一种的方案,统计了十篇不同的文章中字符出现的频率。当前,也可以根据被压缩文件的特性有针对性的进行统计,如要压缩C语言的源文件,则可事先对多篇C语言源文件中出现的字符进行统计,这样,会创建出高度相对较“矮”的Haffman树,从而提高压缩效果。
步骤3: 将需压缩文件中的每个ascii码对应的haffman编码按bit单位输出,这是本压缩程序中最关键的部分。
(3)这里涉及“转换”和“输出”两个关键步骤:
“转换”部分大可不必去通过遍历Haffman树来找到每个字符对应的哈夫曼编码,可以将每个Haffman码值及其对应的ascii码存放于如下所示的结构体中:
七、Code.c核心代码:
Code.c
#include ECBTree.h
#include MyAssert.h
#include stdio.h
#include stdlib.h
#include string.h
#define LENGTH 128
#define DEBUG 1
#define REARPOS 80
char dotTxt[]=.txt; //输入文件(待压缩文件)文件名后缀
char dotRer[]=.rer; //输出文件文件名后缀
int getBinLen(unsigned long inData);
void main(int argc,char* argv[]) //主函数
{
long wList[LENGTH]; //声明主函数中用到的变量以及机构体
文档评论(0)