- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.3 数据压缩的技术基础 数据压缩的基本理论:研究信息究竟能被压缩到多小。 借用了热力学中的名词“熵”来表示一条信息中真正需要编码的信息量。 1、信息量 (1) 某个事件的信息量可表示如下,其中 pi是第i个事件的概率,其中0 pi=1, 2、熵的概念 (1)熵是信息量的度量方法,含义是信源S发出任意一个随机变量的平均信息量。 (2)根据香农理论,信源S的熵定义为: 3、平均码长: 熵值可以理解为最佳平均码长。 4、熵的作用:衡量编码是否为最佳编码。 5、例子 40个像素组成的5级灰度图像(15个A、7个B、7个C、6个D、5个E),用3位来表示每个像素点,共需要120位,经计算这幅图像的熵是2.196,40个像素需用87.84位。 香农-范诺编码 (1)采用从上到下构造一棵二叉树的方法进行编码。 (2)方法: 将给定符号按照其频率从大到小排序; 将序列分成上下两部分,使得上部频率总和尽可能接近下部频率总和; 把第二步中划分出的上部作为二叉树的左子树,记0;下部作为二叉树的右子树,记1; 分别对左右子树重复2、3两步,直到所有的符号都称为二叉树的树叶为止。 2.4.1哈夫曼编码 (1)哈夫曼编码广泛用于各种数据压缩技术中; (2)是熵编码中的最佳编码方法。 1、操作步骤: (1)概率统计得到n个不同的概率的信息符号; (2)将n个信源信息符号的n个概率按概率大小排序; (3)将n个概率中最后两个小概率相加,这时概率个数减为n-1个; (4)将n-1个概率按大小重新排序; (5)重复3),将新排序后的最后两个小概率再相加,相加和与其余概率在排序; (6)如此反复重复n-2次,得到只剩两个概率序列; (7)以二进制码元(0.1)赋值,构成哈夫曼码字。编码结束。 2、举例 3、总结 (1)平均码长 (2)平均码长 (3)保证解码的惟一性,短码字不构成长码字的前缀 (4)在接受端需保存一个与发送端相同的哈夫曼码表 4、注意的问题 (1)没有错误保护功能; (2)为可变长码,很难随意查找或调用压缩文件中间的内容; 2.4.2 算术编码 1、定义:消息用0和1之间的实数进行编码。 2、两个基本参数:符号的概率及其编码间隔。 3、操作步骤: (1)在0和1之间给每个符号分配一个初始子间隔,子间隔的长度等于它的概率; (2)第一个字符所在的区间即为下一步所占的空间,将这个空间按初始空间的划分方式再一次进行划分; (3)第二个字符所在的区间是第二次划分区间中它所在的区间,是下一步划分的区间,依此类推,直到最后一个字符; (4)编码结果为最后一个字符所在区间中的一个小数值。 4、举例: 假设信源符号为{00,01,10,11},这些符号的概率分别为{0.1,0.4,0.2,0.3},根据这些概率可把间隔[0,1)分成4个间隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),要求对消息序列:10 00 11 00 10 11 01进行算术编码。 5、编码公式: 这里low表示上一个被编字符的低端,range表示上一个字符的范围,rangelow,rangehigh表示当前编码字符在初始分隔区间的两端。 6、译码公式: 这里number表示输出的结果,rangelow表示上一次译码字符的低端,range表示上一次译码字符的范围。 7、算术编码需要注意的问题 (1)实际计算机的精度不可能无限长,运算中会出现溢出的问题; (2)整个运算只产生一个码字,译码器在接受到表示这个实数的所有位之前不能进行译码; (3)也是一种对错误很敏感的编码方法,有一位发生错误就会导致整个消息译错。 8、课后作业 消息为“state tree”,要求用算术编码方法对其进行压缩。 2.4.3游程编码 1、定义:对于相同颜色的图块,不需要存储每个像素的值,仅需存储一个像素的颜色值,以及具有相同颜色的像素数目,或者存储一个像素的颜色值,以及具有相同颜色值的行数,即称为游程编码(RLE ,run length encoding)。 利用空间冗余度压缩图像的方法。 2、举例 编码前: 000000001118888888888888888111111000000000共42位 编码后: 80311686190 共11位 3、好处 编码技术相当直观; 非常经济; 4、注意问题 适用于计算机生成的图像; 对颜色丰富的自然图像显得力不从心; 2.4.4字典编
您可能关注的文档
最近下载
- 统编版2024-2025学年一年级语文下册第一单元基础达标卷(含答案 ).pdf VIP
- 2025年人教版五年级下册道德与法治全册期中期末复习资料.pdf
- 内镜下息肉切除及护理配合.pptx VIP
- 〖历史〗秦末农民大起义 课件 2024-2025学年统编版七年级历史上册.pptx VIP
- DBJT 13-475-2024 加筋挡土墙支护技术标准.docx VIP
- 危险化学品企业工艺平稳性 第4部分:开工过程管理规范及编制说明.pdf VIP
- (小升初)北京版2025年六年级下学期期末数学模拟测试卷ABC三卷含答案.pdf VIP
- 危险化学品企业工艺平稳性 第3部分:标准操作程序编制与使用规范及编制说明.pdf VIP
- 气压泵治疗双下肢.pptx VIP
- 中铁集团会计知识大赛试题(定稿).pdf VIP
文档评论(0)