- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
哈夫曼编码的不足 它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就会大打折扣,甚至根本达不到压缩的效果。因此哈夫曼编码通常要经过两遍操作,第一遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。 另外由于各种长度的编码的译码过程也比较复杂,因此解压缩的过程也比较慢。 它对于位的增删比较敏感。 常用的编码算法 √行程长度编码 √哈夫曼编码 香农-范诺编码 算术编码 感知编码 基于语义编码 矢量量化编码 香农-范诺编码 香农-范诺编码与Huffman编码相反,采用从上到下的方法。 具体步骤为: (1)首先将编码字符集中的字符按照出现频度和概率进行排序。 (2)用递归的方法分成两部分,使两个部分的概率和接近于相等。直至不可再分,即每一个叶子对应一个字符。 (3)编码。 香农-范诺编码举例 A B C D E A B C D E D E 符号 A B C D E 次数 15 7 7 6 5 0 1 0 1 0 0 1 1 常用的编码算法 √行程长度编码 √哈夫曼编码 √算术编码 感知编码 基于语义编码 矢量量化编码 算术编码 算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。 算法举例 假设信源符号为{00, 01, 10, 11},这些符号的概率分别为{ 0.1, 0.4, 0.2, 0.3 },根据这些概率可把间隔[0, 1)分成4个子间隔:[0, 0.1), [0.1, 0.5), [0.5, 0.7), [0.7, 1),二进制消息序列的输入为:10 00 11 00 10 11 01 算术编码 算术编码需要注意的几个问题 1. 由于实际计算机精度不可能无限长,运算中溢出是明显的问题,但多数机器都有16位、32位或者64位的精度,因此可使用比例缩放法解决。 2. 算术编码器对消息只产生一个码字,这个码字是在[0, 1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。 3. 算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。 算术编码可以是静态的或者自适应的。在静态算术编码中,信源符号的概率是固定的。在自适应算术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号概率的过程叫做建模。需要开发动态算术编码的原因是因为事先知道精确的信源概率是很难的,而且是不切实际的。当压缩消息时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效方法是在编码过程中估算概率。因此动态建模成为确定编码器压缩效率的关键。 感知编码 感知编码将感知知识应用于编码中。感知编码充分利用了人耳的听觉阈值和掩蔽效应去除声音信号中的冗余数据,已经在声音编码中得到了应用。 感知编码的主要步骤是:首先将输入信号分解为各频谱元素,再根据某个心理听觉阈值和掩蔽门限进行量化编码,最后生成比特流。听觉阈值和掩蔽门限的计算需要对输入信号进行频域分解。 感知编码策略的基本结构框图 分析滤波部件可以进行正交滤波分解,或者再加上某种离散变换 量化和编码都有很多种实现方法,从直接计算标量量化中的比特分配到利用分解综合系统都可以实现量化编码。 这里所说的分析滤波是指先比较量化与非量化的频谱元素,找到每个频谱元素的量化噪声,最后将此噪声与听觉阈值和掩蔽门限比较。 常用的编码算法 √行程长度编码 √哈夫曼编码 √算术编码 √感知编码 基于语义编码 矢量量化编码 基于语义编码 基于语义(semantic-based)编码采用显示模型(如人物的头肩部分)去分析和合成运动图像,景物里的物体三维模型为严格已知。 瑞典Forchheimer等人于1983年提出的就是基于语义图像编码。由于物体模型的有效性,景物中的物体能够描述成语义水平。它可以有效地利用景物中已知物体的知识,实现非常高的压缩比。但它仅能够处理已知物体,并需要较复杂的图像分析与识别技术。 基于语义编码 为了实现基于语义的图像编码,需要根据景物中特定的一些物体,预先建立它们的通用三维模型,最常用的是三维线框模型。3D线框模型由顶点在三维空间运动的互连多角形复合而成,将色彩信息映射到该模型上就能实现合成。例如,人物头部三维线框模型不仅给出面部的几何形状,而且提供了面部表情的描述。 面部表情的变化(例如眨眼、张嘴)可用面部动作编码系统中的动作单元来描述 基于语义编码 以电视电话为例说明。 在开始通
文档评论(0)