- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
哈夫曼编码 * 2007-6 定义 * 哈夫曼编码是一种一致性编码法(又称“熵编码法”),用于数据的无损耗压缩。 根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。 原理 * 首先统计信源中各符号出现的概率,按符号出现的概率从大到小排序; 把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合; 对新的概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合。如此重复进行,直到最后两个概率的和为l; 原理 * 分配码字:码字分配从最后一步开始反向进行,对于每次相加的两个概率,给大的赋O,小的赋1(也可以全部相反,如果两个概率相等,则从中任选一个赋O,另一个赋l即可),读出时由该符号开始一直走到最后的概率和1,将路线上所遇到的O和l按最低位到最高位的顺序排好,就是该符号的哈大曼编码。 编码步骤 * 对给定的n个权值{W1,W2...Wn}构成n棵二叉树的初始集合F= {T1,T2,T3,...,Ti,...,Tn},其中每棵二叉树Ti中只有一个权值为Wi的根结点,它的左右子树均为空。(为方便在计算机上实现算法,一般还要求以Ti的权值Wi的升序排列。) 编码步骤 * 在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树的根结点的权值为其左右子树的根结点的权值之和。 从F中删除这两棵树,并把这棵新的二叉树同样以升序排列加入到集合F中。 重复二和三两步,直到集合F中只有一棵二叉树为止。 示例 * 假如有A,B,C,D,E五个字符,出现的频率(即权值)分别为5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造一个新树,即取1,2构成新树,其结点为1+2=3,如图: 虚线为新生成的结点,第二步再把新生成的权值为3的结点放到剩下的集合中,所以集合变成{5,4,3,3},再根据第二步,取最小的两个权值构成新树,如图: 示例 * 再依次建立哈夫曼树,如下图: 各字符对应的编码为:A-11,B-10,C-00,D-011,E-010 五、程序部分代码及其分析 * 实现过程:首先通过 HuffmanTree() 函数构造哈夫曼树,然后在主函数 main()中自底向上开始(也就是从数组序号为零的结点开始)向上层层判断,若在父结点左侧,则置码为 0,若在右侧,则置码为 1。最后输出生成的编码。 typedef struct { int bit[MAXBIT]; int start; } HCodeType; /* 编码结构体 */ 五、程序部分代码及其分析 * typedef struct { int weight; int parent; int lchild; int rchild; int value; } HNodeType; /* 结点结构体 */ 五、程序部分代码及其分析 * * 初始化存放哈夫曼树数组 HuffNode[] 中的结点 */ for (i=0; i2*n-1; i++) { HuffNode[i].weight = 0;//权值 HuffNode[i].parent =-1; HuffNode[i].lchild =-1; HuffNode[i].rchild =-1; HuffNode[i].value=i; //实际值,可根据情况替换为字母 } /* end for */ 五、程序部分代码及其分析 * /* 循环构造 Huffman 树 */ for (i=0; in-1; i++) { m1=m2=MAXVALUE; /* m1、m2中存放两个无父结点且结点权值最小的两个结点 */ x1=x2=0; /* 找出所有结点中权值最小、无父结点的两个结点,并合并之为一颗二叉树 */ for (j=0; jn+i; j++) { if (HuffNode[j].weight m1 HuffNode[j].parent==-1) { m2=m1; x2=x1; m1=HuffNode[j].weight; x1=j; }
原创力文档


文档评论(0)