03 数据压缩基础.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据压缩基础 数据压缩基础 数据压缩编码技术概述 多媒体数据压缩的必要性和可行性 衡量多媒体数据压缩技术的指标: 压缩比 算法简单,压缩解压缩速度快 尽可能地恢复原始数据 压缩方法分类 无损压缩:Huffman编码、游程编码、算术编码、LZW编码 有损压缩:预测编码、变换编码、模型编码、基于重要性的编码、混合编码 新一代的数据压缩方法:矢量量化和子代编码、基于模型的压缩、分形压缩、小波变换压缩等等。 问题的提出 1分钟数字音频信号的存储空间 1分钟数字视频信号的存储空间 视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。 原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。 数据压缩的好处 时间域压缩──迅速传输媒体信源 频率域压缩──并行开通更多业务 空间域压缩──降低存储费用 能量域压缩──降低发射功率 数据压缩技术实现的衡量标准 压缩比要大 恢复后的失真小 压缩算法要简单、速度快 压缩能否用硬件实现 多媒体数据压缩方法根据不同的依据可产生不同的分类 根据质量有无损失可分为有损失编码和无损失编码。 按照其作用域在空间域或频率域上分为空间方法、变换方法和混合方法。 根据是否自适应分为自适应性编码和非适应性编码。 多媒体数据压缩技术分类 平均信息量编码──可逆压缩──去冗余──统计特性 源编码──不可逆压缩──有失真编码 特征提取等 两种压缩技术不互斥,两种压缩技术的结合,可以达到最高可能的压缩率。 依据压缩算法分类 统计编码 Huffman编码、行程编码、LZW编码、算术编码 预测编码 差分(DPCM)、自适应差分脉码调制(ADPCM) 变换编码 最佳变换(K-L)、DCT 混合编码 量化编码、小波变换、分形图像编码、子带编码 香农-范诺(Shannon- Fano)算法 最早阐述和实现这种编码的是Shannon(1948)和Fano(1949) 采用从上到下的编码方法 首先按照符号出现的频率或概率排序,然后使用递归方法分成两个部分,每一部分具有相似的次数。 香农-范诺算法举例 40个像素5级(ABCDE)灰度图象,如果每个像素用3位来表示,编码这幅图象共需120位。 采用熵编码则需91位,压缩比为1.3:1。 霍夫曼(Huffman)编码 霍夫曼(Huffman)在1952年提出了另一种编码方法,即从下到上的编码方法。步骤如下: 为每个字符指定一个只包含一个节点的二叉树。把字符的频率指派给对应的树,称之为树的权 寻找权最小的两棵树。如果多于两棵,就随机选择。然后把这两棵树合并成一棵带有新的根节点的树,其左右子树分别是我们所选择的那两棵树 重复前面的步骤直到只剩下最后一棵树 霍夫曼(Huffman)编码 霍夫曼(Huffman)编码 霍夫曼(Huffman)编码 霍夫曼(Huffman)编码 霍夫曼码的码长虽然是可变的,但却不需要另外附加同步代码。几个个问题值得注意: 霍夫曼码没有错误保护功能; 霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码; 接收端需保存一个与发送端相同的霍夫曼码表。 霍夫曼(Huffman)编码 信源符号概率是2的负幂次方时,编码效率达到100%。 依赖于信源的统计特性,必须先统计得到信源的概率特性才能编码,这就限制了实际的应用 缺乏构造性,即它不能用某种数学方法建立起消息和码字之间的一一对应关系,而只能通过某种查表的方法建立起它们的对应关系。 如果消息数目很多,那么所需存储的码表也很大,这将影响系统的存储量及编、译码速度。 算法举例 假设信源符号为{00, 01, 10, 11},这些符号的概率分别为{ 0.1, 0.4, 0.2, 0.3 },根据这些概率可把间隔[0, 1)分成4个子间隔:[0, 0.1), [0.1, 0.5), [0.5, 0.7), [0.7, 1),二进制消息序列的输入为:10 00 11 00 10 11 01 算法举例 算术编码 算术编码可以是静态的或者自适应的。 在静态算术编码中,信源符号的概率是固定的。 在自适应算术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号概率的过程叫做建模。需要开发动态算术编码的原因是因为事先知道精确的信源概率是很难的,而且是不切实际的。当压缩消息时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效的方法是在编码过程中估算概率。因此动态建模就成为确定编码器压缩效率的关键。 LZW算法的中心思想 为原始文本文件中的每个字

文档评论(0)

克拉钻 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档