- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
算法设计与分析_第4章_贪心算法2
算法设计与分析
第4章贪心算法
(2)
1
哈夫曼编码
文件压缩问题
输入:给定符号表和一段数据
输出:给每个符合赋一个编码,使给定数据
在编码下的长度最短
2
哈夫曼编码
二进制字符编码:
每个字符用一个二进制0、1 串来表示。
固定长编码
每个字符都用相同长的0、1 串表示。
可变长编码
经常出现的字符用短码,丌经常出现的用长
码。
3
哈夫曼编码
a b c d e f
频率(千次) 45 13 12 16 9 5
定长码 000 001 010 011 100 101
变长码 0 101 100 111 1101 1100
定长码
45 ×3+13 ×3+12 ×3+16 ×3+9 ×3+5 ×3=300
变长码
减少约
45 ×1+13×3+12 ×3+16 ×3+9 ×4+5 ×4=224
25%
频率越高,其编码越短,频率越低,编码越长
4
哈夫曼编码
哈夫曼编码
广泛地用于数据文件压缩的十分有效的编码
方法。压缩率通常在20% ~90%乊间。
用字符在文件中出现的频率表来建立一个用
0 ,1串表示各字符的最优表示方式。
基本思想
将字符按照出现频率从高到低排序
给出现频率高的字符较短的编码,出现频率
较低的字符以较长的编码,以大大缩短总码
长。
5
哈夫曼编码
构造哈夫曼编码
哈夫曼提出构造最优前缀码的贪心算法 ,由
此产生的编码方案称为哈夫曼编码。
分析
频率最高?
排序
最短编码?
哈夫曼树
6
哈夫曼编码
可变长码的问题?
译码歧义:编码后的消息可能有多种译码方
式
前缀码
对每一个字符规定一个0,1串作为其编码,并
且任一字符的编码都丌是其它字符的编码的
前缀。这种编码称为具有前缀性质(或者前
缀码)。
例如
001011101分解为0,0,101,1101,aabe
7
哈夫曼编码
通常用二叉树来作为前
缀编码的数据结构
编码树
叶结点:用字符及其出现
频率标记。
内
文档评论(0)