- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
哈夫曼算法实现字符串压缩–实验报告单
华北科技学院 《用哈夫曼编码实现文件压缩》实验报告
《用哈夫曼编码实现文件压缩》
实 验 报 告
课程名称 《数据结构B》
实验学期 2011 至 2012 学年 第 一 学期
学生所在系部 计算机系
年级 2009级 专业班级 计科B09—1
学生姓名 韩翼 学号 200907014106
任课教师 盛建瓴
实验成绩
一、实验题目:
用哈夫曼编码实现文件压缩
二、实验目的:
了解文件的概念。
掌握线性链表的插入、删除等算法。
3、掌握Huffman树的概念及构造方法。
4、掌握二叉树的存储结构及遍历算法。
5、利用Huffman树及Huffman编码,掌握实现文件压缩的一般原理。
三、实验设备与环境:
微型计算机、Windows 系列操作系统 、Visual C++6.0软件
四、实验内容:
根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。
五、概要设计:
本次试验采用将字符用长度尽可能短的二进制数位表示方法,即对于文件中出现的字符,无须全部都用8位的ASCLL码进行存储,根据他们在文件中出现的频率不同,我们利用Haffman算法使每个字符能以最短的二进制字符进行存储,以达到节省存储空间,压缩文件的目的。解决了压缩需采用的算法,程序的思路已然清晰:
统计需压缩文件中每个字符出现的频率。
将每个字符的出现频率作为叶子结点构建Haffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1” ; 每个字符的编码即为从根到每个叶子的路径上得到的0、1序列,这样便完成了Haffman编码,将每个字符用最短的二进制字符表示。
打开需压缩的文件,再将需压缩文件中的每个ASCII码对应的编码按bit单位输出。
文件压缩结束。
六、详细设计:
(1)Huffman树简介
路径:从树中一个结点到另一个结点之间的分支构成这两个结点间的路径
路径长度:路径上的分支数
树的路径长度:从树根到每一个结点的路径长度之和
树的带权路径长度:树中所有带权结点的路径长度之和
Huffman树——设有n个权值{w1,w2,……wn},构造一棵有n个叶子结点的二叉树,每个叶子的权值为wi,则wpl最小的二叉树叫Huffman树。
(2)构造Huffman树的方法——Huffman算法
构造Huffman树步骤
(a)根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,令起权值为wj。
(b)在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。
(c)在森林中删除这两棵树,同时将新得到的二叉树加入森林中。
(d)重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。
对于Haffman 的创建算法,有以下几点说明:
a) 这里的 Haffman 树采用的是基于数组的带左右儿子结点及父结点下标 作为存储结点的二叉树形式,这种空间上的消耗带来了算法实现上的便捷。
b) 由于对于最后生成的 Haffman 树,其所有叶子结点均为从一个内部树扩充出去的,所以,当外部叶子结点数为m 个时,内部结点数为m-1,整个Haffman树的需要的结点数为2m-1
c) 初始化 Hafffman 树分两步进行,先将所有结点赋值,再将前m 个叶子结点赋初值。
d) 在查找权值最小并且父结点为空的两个结点时,通过逐个比较,将两结
点的位置下标与权值分别保存。方便在与其父结点建立联系时调用。
(3)Huffman编码:数据通信用的二进制编码
思想:根据字符出现频率编码,使电文总长最短
编码:根据字符出现频率构造Huffman树,然后将树中结点引向其左孩子的分支标“0”, 引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列。
(4)压缩过程的实现:
压缩过程的流程是清晰而简单的:1创建Haffman 树2 打开需压缩文件 3 将需压缩文件中的每个ASCII码对应的Haffman 编码按bit 单位输出??4 文件压缩结束。其中,步骤 1 和步骤3 是压缩过程的关键。
a) 步骤 1
您可能关注的文档
最近下载
- 销售行业述职报告5篇.docx VIP
- 英语必备词汇(思维导图版).doc VIP
- 汽油、柴油仓储及50万吨_年甲醇汽油调配添加剂调制项目可行性研究报告中润油新能源股份有限公司.doc VIP
- GB T 3810.14-2016 陶瓷砖试验方法第14部分 耐污染性的测定.docx VIP
- AIAG 第三版APQP产品质量先期策划培训教程-学员版.pdf VIP
- 文件检验相关知识试卷涵盖检验准备鉴定等内容.doc
- 人教版初中化学知识总结.pdf VIP
- 2024江西工业职业技术学院数学专任教师岗位招聘3人笔试备考题库及答案解析.docx VIP
- 工业碳排放绩效研究.pptx VIP
- 瓦楞纸板箱生产环境质量控制手册与程序汇编指南.docx VIP
文档评论(0)