- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * 构造Huffman树的步骤(即Huffman算法): 由给定的 n 个权值{ w1, w2, …, wn }构成n棵二叉树的集合F = { T1, T2, …, Tn } (即森林) ,其中每棵二叉树 Ti 中只有一个带权为 wi 的根结点,其左右子树均空。 (2) 在F 中选取两棵根结点权值最小的树 做为左右子树构造一棵新的二叉树,且让新二叉树根结点的权值等于其左右子树的根结点权值之和。 (3) 在F 中删去这两棵树,同时将新得到的二叉树加入 F中。 (4) 重复(2) 和(3) , 直到 F 只含一棵树为止。这棵树便是Huffman树。 * 对权值进行合并、删除与替换 ——在权值集合{7,5,2,4}中,总是合并当前值最小的两个权 具体操作步骤: a. 初始 b. 合并{2} {4} c. 合并{5} {6} d. 合并{7} {11} 谁左谁右? 不规定就不会惟一 * 9 例题:已知权值 W={ 5, 6, 2, 9, 7 }, 建立对应的Huffman树 5 6 2 7 9 2 5 7 16 6 7 13 29 * Huffman树的应用: 例:设有4个字符d,i,a,n,出现的频度分别为7,5,2,4,怎样编码才能使它们组成的报文长度最短? 法1:等长编码(如二进制编码) 令d=00,i=01,a=10,n=11,则: WPL1=2bit×(7+5+2+4)=36 法2:不等长编码(如Huffman编码) 令d=0;i=10,a=110,n=111,则: WPL2=1bit×7+2bit×5+3bit×(2+4)=35 明确:要实现Huffman编码,就要先构造Huffman树 讨论:Huffman树有什么用? 频度高的信息用短码,低的用长码,传输效率肯定高! 最小冗余编码、信息高效传输 * 按左“0”右“1” 对Huffman树的所有分支编号 d a i n 1 1 1 0 0 0 Huffman编码结果:d=0, i=10, a=110, n=111 WPL=1bit×7+2bit×5+3bit×(2+4)=35 (小于等长码的WPL=36) 特征:每一码不会是另一码的前缀,译码时可惟一复原 Huffman编码也称为前缀码 Huffman编码 * 哈夫曼编码 哈夫曼树的应用很广,哈夫曼编码就是其在电讯通信中的应用之一。在电讯通信业务中,通常用二进制编码来表示字母或其他字符,并用这样的编码来表示字符序列。 例:如果需传送的电文为 ‘ABACCDA’,它只用到四种字符,用两位二进制编码便可分辨。假设 A, B, C, D 的编码分别为 00, 01, 10, 11,则上述电文便为 ‘00010010101100’(共 14 位),译码员按两位进行分组译码,便可恢复原来的电文。 能否使编码总长度更短呢? * 实际应用中各字符的出现频度不相同 数据的最小冗余编码问题 用短(长)编码表示频率大(小)的字符 使得编码序列的总长度最小,使所需总空间量最少 若假设 A, B, C, D 的编码分别为 0,00,1,01,则电文 ‘ABACCDA’ 便为 ‘000011010’(共 9 位)。 可译为 ‘BBCCDA’、‘ABACCDA’、‘AAAACCACA’ 存在多义性 * 要求任一字符的编码都不能是另一字符编码的前缀! 这种编码称为前缀编码(其实是非前缀码)。 译码的惟一性问题 利用最优二叉树可以很好地解决上述两个问题 在编码过程要考虑两个问题 数据的最小冗余编码问题 译码的惟一性问题 * 以电文中的字符作为叶子结点构造二叉树。然后将二叉树中 结点引向其左孩子的分支标 ‘0’,引向其右孩子的分支标 ‘1’; 每 个字符的编码即为从根到每个叶子的路径上得到的 0, 1 序列。如 此得到的即为二进制前缀编码。 用二叉树设计二进制前缀编码 例: A B C D 0 1 0 1 0 1 编码: A:0 B:10 C:110 D:111 任意一个叶子 结点都不可能 在其它叶子结 点的路径中。 * 假设各个字符在电文中出现的次数(或频率)为 wi ,其编码长度为 li,电文中只有 n 种字符,编码总长为: 叶子结点的权 从根到叶子的路径长度 设计电文总长最短的编码 设计哈夫曼树(以 n 种 字符出现的频率作权) 用哈夫曼树设计总长最短的二进制前缀编码 由哈夫曼树得到的二进制前缀编码称为哈夫曼编码 * 解: A C B D 0 0 0 1 1 1 编码
您可能关注的文档
最近下载
- 1-1运动的描述(解析版)—2024高考物理一轮复习100考点100讲.docx VIP
- 人教版五年级下册数学期末卷及参考答案(综合题).docx VIP
- 1-2匀变速直线运动规律(解析版)—2024高考物理一轮复习100考点100讲.docx VIP
- 铜合金熔炼-熔炼设备与操作.pptx VIP
- 2-4动态平衡与极值(解析版)—2024高考物理一轮复习100考点100讲.docx VIP
- 人教版数学三升四暑假作业每日一练(共40天).docx VIP
- 给水排水工程顶管技术规程CECS_246:2008.pdf VIP
- 【27页PPT】基于大数据的数据挖掘数据中台数据安全架构设计方案.pptx VIP
- 青少年礼仪礼节.ppt VIP
- 施工质量保证措施方案.doc VIP
文档评论(0)