文本文件统计Hffman编解码.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文本文件统计Hffman编解码

JISHOU UNIVERSITY 专业课课程论文 题 目: 文本文件统计Huffman编解码 作 者: 学 号: 所属学院: 信息科学与工程学院 专业年级: 09级 总 评 分: 完成时间: 2012年10月24日 吉首大学信息科学与工程学院 文本文件统计Huffman编解码 1、编程思想 霍夫曼(Huffman)编码是1952年为文本文件而建立,是一种统计编码。属于无损压缩编码。霍夫曼编码的码长是变化的,对于出现频率高的信息,编码的长度较短;而对于出现频率低的信息,编码长度较长。这样,处理全部信息的总码长一定小于实际信息的符号长度。 计算机编程实现时,首先统计带编码的文本文件中各个字符出现的概率,然后将概率作为节点的权值构建huffman树。编码时从叶子节点出发,如果这个节点在左子树上,则编码0,否则编码1,直到根节点为止,所得到的01序列即为该叶子节点的编码。所有叶子节点的编码构成一个码本。 有两种译码方法:(1)按位读入码字,从已建好的Huffman树的根节点开始,若码字为“0”,则跳到左子树,若为“1”则跳到右子树,直到叶子结点为止,输出叶子接点所表示的符号。(2)由于Huffman编码是唯一码,还有另一种译码方法,每读入一位编码就去码本中去匹配相应的码字,若匹配不成功,则继续读入下一个编码,直到匹配成功为止。显然前一种方法比较简便,本程序采用便是该方法。 2、程序流程图 N N N Y Y N 开始编码 读入文本文件 统计各符号概率 构建Huffman树 保存码本 读入1位码字 编码 输出编码文件 编码结束 开始译码 读入码本 定位到根节点 码字为1? 跳到右子树 译码结束 叶子结点? ? 跳到左子树 输出字符 Y 码字读完? 内容: 问题重述:从电脑上打开一个文件,统计其字符数及每一字符出现的频数概率,然后进行Huffman编码;编码后将其解码,并与原数据比较 算法描述:(1)统计字符数,及每一字符出现的频数和概率。创立一个足够大的字符型数组,然后遍历整个文件,将文件中每一字符拷贝到字符数组中;然后建立一个结构体类型数组p[](足够大),此类型包括三个成员char chh型的字符变量、int n型的变量用以统计每个字符出现的频数和float rate用以存储每个字符出现的概率。 (2)建立Huffman树。创建一个结构体类型如下 typedef struct { float rate;//字符出现的概率 int parent;//节点的双亲结点 int Lchild;//节点的左孩子 int Rchild;//节点的右孩子 }HTNode,*HuffmanTree; typedef char * *HuffmanCode; 对有n个叶子节点的Huffman树共有2*n-1个节点,就可以用2*n-1个一维数组来存放各个节点,每个节点同时还包含双亲节点和孩子节点的信息,构成一个静态三叉链表。令m=2*n-1, 从内存申请空间*ht=(HuffmanTree )malloc((m+1)*sizeof(HTNode));初始化(0号单元不使用), 从1到n令(*ht)[i]={rate[1],0,0,0},n+1到m号单元初始化为(*ht)[i]={0,0,0,0}; for(int i=n+1;i=m;i++)//创建非叶子节点 { select(ht,i-1,s1,s2);//从1到1-1内选择双亲节点为0的两个权值最小的节点,将其序号复制给s1、s2返回 (*ht)[s1].parent=i;(*ht)[s2].parent=i; (*ht)[i].Lchild=s1;(*ht)[i].Rchild=s2; (*ht)[i].rate=(*ht)[s1].rate+(*ht)[s2].rate; }//Huffman树创建完毕 编码解码(略) “1.txt”的内容如下: 程序执行结果: 代码: #include stdio.h #includeconio.h #includestdlib.h #includestring.h #define MAX 1000 struct Char { char chh; int n; float rate; }*p;//用于统计文档中字符的数目与频数及每一字符出现的概率 typedef struct { float rate;//每个字符出现的概率 int parent;//节点的双亲节点 int Lchild;//节点的左孩子节点 int Rchild;//节点的右孩子节

文档评论(0)

phltaotao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档