赫夫曼树实验报告.docVIP

下载本文档

24
0
约3.73千字
约 7页
2017-02-08 发布于重庆
举报

赫夫曼树实验报告.doc

赫夫曼树实验报告

实验报告实验原理：霍夫曼编码（Huffman Coding）是一种编码方式，是一种用于无损数据压缩的熵编码（权编码）算法。1952年，David A. Huffman在麻省理工攻读博士时所发明的。在计算机数据处理中，霍夫曼编码使用变长编码表对源符号（如文件中的一个字母）进行编码，其中变长编码表是通过一种评估来源符号出现机率的方法得到的，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码，这便使编码之后的字符串的平均长度、期望值降低，从而达到无损压缩数据的目的。例如，在英文中，e的出现机率最高，而z的出现概率则最低。当利用霍夫曼编码对一篇英文进行压缩时，e极有可能用一个比特来表示，而z则可能花去25个比特（不是26）。用普通的表示方法时，每个英文字母均占用一个字节（byte），即8个比特。二者相比，e使用了一般编码的1/8的长度，z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算，就可以大幅度提高无损压缩的比例。霍夫曼树又称最优二叉树，是一种带权路径长度最短的二叉树。所谓树的带权路径长度，就是树中所有的叶结点的权值乘上其到根结点的路径长度（若根结点为0层，叶结点到根结点的路径长度为叶结点的层数）。树的路径长度是从树根到每一结点的路径长度之和，记为WPL=(W1*L1+W2*L2+W3*L3+...+Wn*Ln)，N个权值Wi（i=1,2,...n）构成一棵有N个叶结点的二叉树，相应的叶结点的路径长度为Li（i=1,2,...n）。可以证明霍夫曼树的WPL是最小的。实验目的：本实验通过编，掌握，并能熟练C语言的指针实现构建赫夫曼二叉树，培养理论联系实际和自主学习的能力，加强对数据结构的原理理解，提高编程水平。实验内容：（1）实现输入的英文字符串输入，并设计算法分别统计不同字符在该字符串中出现的次数，字符要区分大小写；（2）实现赫夫曼树的构建算法；（3）遍历赫夫曼生成每个字符的二进制编码；（4）显示输出每个字母的编码。七、实验器材（设备、元器件）： PC机一台，装有C语言集成开发环境。数据结构与程序： #include iostream #include cctype using namespace std; typedef struct HuffNode { int weight; struct HuffNode *lchild, *rchild, *parent; } HuffNode, *HuffPtr; void select(HuffPtr, int *, int *, int); void createHuffTree(HuffPtr, int *, int); void getCode(HuffPtr, int, int *); void _free(HuffPtr); void main() { char ch; int count = 0; int refer[52] = {0}; coutPlease input:endl; while((ch = getchar()) != \n) { if(isalpha(ch) isupper(ch)) refer[ch-A+26]++; else if(isalpha(ch) islower(ch)) refer[ch-a]++; count++; } HuffPtr header = new HuffNode[2*count-1]; createHuffTree(header, refer, count); getCode(header, count, refer); _free(header); } void select(HuffPtr header, int *node1, int *node2, int all)//选择权值最小 { static bool flag[103] = {false}; int min = all; for(int i = 0;i all;i++) { if(header[i].weight 0 header[i].weight min !flag[i]) { *node1 = i; min = header[i].weight; flag[i] = true; } } min = all; for(int i = 0;i all;i++) { if(header[i].weight 0 header[i].weight min !flag[i]) { *node2 = i; min = header[i].wei

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

赫夫曼树实验报告.docVIP