- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据结构第7章4
7.6 Huffman树及其应用 一、 Huffman树(最优二叉树) 树的带权路径长度如何计算? 1. 构造Huffman树的基本思想: 2. 构造Huffman树的步骤(即Huffman算法): 具体操作步骤: step2:按左“0”右“1” 对Huffman树的所有分支编号 二、Huffman编码 如何编程实现Huffman编码? 如何编程实现Huffman编码? (续前)再求出n个字符的Huffman编码HC Huffman编码举例 w={ 7, 19, 2, 6, 32, 3, 21, 10 }在机内存储形式为: 小结:哈夫曼树及其应用 上机实验说明:设字符集为26个英文字母,其出现频度如下表所示。 本 章 小 结 * * 一、Huffman树 二、Huffman编码 最优二叉树 Huffman树 Huffman编码 带权路径长度最短的树 不等长编码 是通信中最经典的压缩编码 路 径: 路径长度: 二叉树的路径长度: 二叉树的带权路径长度: Huffman树: 由一结点到另一结点间的分支所构成。 路径上的分支数目。 从二叉树根到每一结点的路径长度之和。 从二叉树根结点到所有叶子结点的路径长度与相应叶子结点权值的乘积(WPL) 若干术语: d e b a c f g 即树中所有叶子结点的带权路径长度之和 带权路径长度最小的树。 例如:a→e的路径长度= 树长度= 2 10 Huffman常译为赫夫曼、霍夫曼、哈夫曼等 WPL = ?wklk k=1 n a b d c 7 5 2 4 (a) c d a b 2 4 5 7 (b) b d a c 7 5 2 4 (c) 经典之例: WPL= WPL= WPL= Huffman树是WPL 最小的树 树中所有叶子结点的带权路径长度之和 36 46 35 例:设有4个字符d,i,a,n,出现的频度分别为7,5,2,4, 怎样编码才能使它们组成的报文在网络中传得最快? 法1:等长编码(如二进制编码) 令d=00,i=01,a=10,n=11,则: WPL1=2bit×(7+5+2+4)=36 法2:不等长编码(如Huffman编码) 令d=0;i=10,a=110,n=111,则: 明确:要实现Huffman编码,就要先构造Huffman树 讨论:Huffman树有什么用? 权值大的结点用短路径,权值小的结点用长路径。 WPL最小的树 频度高的信息用短码,反之用长码,传输效率肯定高! WPL2=1bit×7+2bit×5+3bit×(2+4)=35 最小冗余编码、信息高效传输 (1) 由给定的 n 个权值{ w1, w2, …, wn }构成n棵二叉树的集合F = { T1, T2, …, Tn } (即森林) ,其中每棵二叉树 Ti 中只有一个带权为 wi 的根结点,其左右子树均空。 (2) 在F 中选取两棵根结点权值最小的树 做为左右子树构造一棵新的二叉树,且让新二叉树根结点的权值等于其左右子树的根结点权值之和。 (3) 在F 中删去这两棵树,同时将新得到的二叉树加入 F中。 (4) 重复(2) 和(3) , 直到 F 只含一棵树为止。这棵树便是Huffman树。 怎样证明它就是WPL最小的最优二叉树?参考《信源编码》 Huffman树的特点:没有度为1的结点。 step1:对权值进行合并、删除与替换 ——在权值集合{7,5,2,4}中,总是合并当前值最小的两个权 a. 初始 方框表示外结点(叶子,字符) 圆框表示内结点(合并后的权值) b. 合并{2} {4} c. 合并{5} {6} d. 合并{7} {11} d a i n 1 1 1 0 0 0 Huffman编码结果:d=0, i=10, a=110, n=111 WPL=1bit×7+2bit×5+3bit(2+4)=35(小于等长码的WPL=36) 特征:每一码不会是另一码的前缀,译码时可惟一复原 Huffman编码也称为前缀码 ——将 Huffman树 与 Huffman编码 挂钩 (1)由于Huffman树的WPL最小,说明编码所需要的比特数最少。 (4) Huffman编码时是从叶子走到根;而译码时又要从根走到叶子,因此每个结点需要增开双亲指针分量(连同结点权值共要开5个分量) (5)用计算机实现时,顺序和链式两种存储结构都要用到。 分析Huffman树和编码的特点: 霍夫曼编码的基本思想是—— 出现概率大的信息用短码,概率小的用长码,最小冗余 这种编码已广泛应用于网络通信中。 (2) Huffman树肯定没有度为1的结点; (3)一棵有n 0个叶子结点的Huffman树,共有2n0-1个结点; (因为n=n0+n1+n2=2n0-1) 建议1:Huffman树
文档评论(0)