《图像压缩原理》PPT课件.ppt

下载文档

14
0
约8.83千字
约 33页
2019-12-08 发布于四川
举报
版权申诉
保障服务

《图像压缩原理》PPT课件.ppt

1、本文档共33页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

《8-短信、邮件、计划任务《8-短信、邮件、计划任务《8-短信、邮件、计划任务

模型编码目前的研究目标主要集中于可视电话和会议电视的应用中。这是因为此类应用传送的图像中主要感兴趣的内容是人的头肩像，是一种基本固定的特定场景，因此可以预先建立人体头肩像的三维模型，从而进行模型编码。人的头肩像三维模型由人脸形状模型和脸部表情模型两部分组成。其形状模型可用许多小三角形的组合即“线框”（Wireframe）去逼近，脸部表情模型由“基本活动单元”（Action Unit）的线性组合来实现。通信时首先要将被传输对象的基本特征传送到对方，以建立人的头肩像三维模型；通信开始后，当头部发生运动、脸部表情发生变化时，抽取这些运动和变化的参数并对其进行编码发送给对方；接收端用已知的三维模型和收到的参数，用图像合成技术重建图像。由于头部运动和脸部表情参数变化是一种非刚体运动，精确的运动估值是相当困难的。目前采用的是在一定约束条件下建立在预测和反馈技术上的运动跟踪算法。 2．混合编码用两种或两种以上的方法对图像进行编码称为混合编码，是今年来广泛采用的一种方法。混合编码通常使用DCT等变换进行空间冗余度的压缩，用帧间预测或运动补偿预测进行时间冗余度的压缩，以达到对运动图像的更高的压缩率。后面要介绍的JPEG和MPEG都属于混合编码。混合编码器有两种不同的结构，如图4-8所示，分别表示空/时压缩和时/空压缩两种不同的方案。图4-8是这两种方案的结构框图，其中T、IT代表正、反变换，Q、IQ代表正、反量化。方案I由于把变换部分放在预测环内，因此预测环本身工作在图像域内，便于使用性能优良、带有运动补偿的帧间预测，因而被广泛地应用于研究和使用；而方案II由于把变换部分放在预测环外，需要在变换域（频率域）进行预测，处理上不方便。方案I经过若干年的研究总结后，发展为带有运动补偿性质的帧间预测与DCT结合的方案。这一方案具有压缩性能高、编码技术成熟，以及编码延迟短等特点，目前已成为运动图像压缩的主流方案。第4讲图像压缩原理学习目标 l??了解多媒体数据压缩编码的重要性和分类 l???掌握图像数据压缩编码常用算法的基本原理?? 数据压缩编码简介图像数据压缩的主要依据有两个：一是图像数据中有许多重复的数据，使用数学方法来表示这些重复数据就可以减少数据量；另一个依据是人眼睛对图像细节和颜色的辨认有一个极限，把超过极限的部分去掉，这也就达到了数据压缩的目的。有损压缩技术和无损压缩技术基于数据冗余的压缩技术是无损压缩技术基于人眼视觉特性的压缩技术是有损压缩技术。实际上，图像压缩技术是各种有损和无损压缩技术的综合实现。数据压缩方法的分类根据编、解码后数据是否一致来进行分类，数据压缩的方法一般被划分为两类：可逆编码（无损编码）。此种方法的解码图像与原始图像严格相同，压缩比大约在2:1~5:1之间。主要编码有Huffman编码、算术编码、行程长度编码等。不可逆编码（有损编码）。此种方法的解码图像与原始图像存在一定的误差，但视觉效果一般可以接受，压缩比可以从几倍到上百倍调节。常用的编码有变换编码和预测编码。根据压缩的原理分：（1）预测编码。它是利用空间中相邻数据的相关性来进行压缩数据的。通常用的方法有脉冲编码调制（PCM）、增量调制（DM）、差分脉冲编码调制（DPCM）等。这些编码主要用于声音的编码。（2）变换编码。该方法将图像时域信号转换为频域信号进行处理。这种转换的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内能量常常集中在一起，数据处理时可以将主要的注意力集中在相对较小的区域，从而实现数据压缩。一般采用正交变换，如离散余弦变换（DCT）、离散傅立叶变换（DFT）（3）量化与向量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为了使整体量化失真最小，就必须依据统计的概率分布设计最优的量化器。最优的量化器一般是非线性的，已知的最优量化器是Max量化器。我们对像元点进行量化时，除了每次仅量化一个点的方法外，也可以考虑一次量化多个点的做法，这种方法称为向量量化。即利用相邻数据间的相关性，将数据系列分组进行量化。（4）信息熵编码。依据信息熵原理，让出现概率大的信号用较短的码字表示，反之用较长的码字表示。常见的编码方法有Huffman编码、Shannon编码以及算术编码。（5）子带（subband）编码。将图像数据变换到频率后，按频率分带，然后用不同的量化器进行量化，从而达到最优的组合。或者分布渐进编码，在初始时，对某一个频带的信号进行解码，然后逐渐扩展到所有频带。根据压缩的原理分：（续）信息熵及基本概念 1．信息量与信息熵信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量或含量，也就是在辨识N个事件中特定的一个事件的过程中