第8章-现代编码技术.pptVIP

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章 现代编码技术 8.1 传统信源编码的应用 8.2 现代信源编码技术 8.3 密码学研究现状及趋势 8.4 多媒体信息伪装 8.5 人工神经网络 8.1 传统信源编码的应用 根据信源编码技术的发展可以将其分为传统编码技术与现代编码技术两大类。传统编码技术主要有脉码调制(PCM,PulseCode Modulation)、量化法(Quantization)、空间和时间子抽样编码(Spatialand Temporal Subsampling Coding)、熵编码(Entropy Coding)、预测编码(Predictive Coding)、变换编码(Transform Coding)、矢量量化(VQ,Vector Quantization)、子带编码(SBC,Subband Coding)等方法。 这些方法前面已经介绍过,下面以图像信源为例简述传统信源编码技术的应用。 采用脉码调制方法进行信源编码时,输入的连续信号通常以Nyquist速率采样,然后均匀量化。因此,它只是原始模拟信号的一种数字表示。量化器通常有N个电平,其中N是2的乘方(N=2b),每个采样由一个具有b比特的固定长度的二进制码示。使用PCM对像素编码所需的比特数取决于被编码信源的类型。通常来说,单色广播或会议电视图像用8比特就足够了;而医学图像则可能需要10比特或更多,以保证足够的幅度分辨率。 对于彩色图像,每个彩色分量通常需要8比特,因而表示一个彩色像素共要使用24比特。PCM编码的效率是不高的,原因之一是PCM忽视了像素之间的空间和时间相关性;之二是它对所有量化幅度电平进行同样处理,即均匀量化;另外一个原因是它没有利用人眼的视觉特性。 量化是一个相当直观的数据压缩方法,其过程相当于将输入数据的取值范围加以限制。比如,图像像素,即图像中的一个采样点的灰度值是用8比特二进制数表示,将其灰度量化至2比特,即用2比特二进制数来表现原8比特的数据。显然,在数据量上,量化后的比特数是原来的0.25倍,相应压缩比为4∶1。量化过程的实际做法是利用量化查找表使一个输出值对应于若干个输入值。量化算法利用人的视觉对不同亮度值域的敏感程度不一样的特点,在一定输出图像质量的前提下,调节量化查找表达到最佳的压缩比。根据量化查找表的性质,量化算法分为线性与非线性两类。 在电视、电话等某些应用中,全分辨率不是必需的。这时,可以使用空间和时间子抽样来降低数据速率。在编码器中,从每几个像素中选择一个像素,从每几帧中选择一帧,然后加以传输。在译码器中,可根据接收的像素和帧内插丢失的像素和帧,再生出分辨率较低的原始视频序列。如果像素是由色度和亮度分量表示的,那么可以以较高的比率对色度分量进行子抽样,量化更粗略一些,这是因为人眼对色度分量的敏感性低一些。这种技术非常简单,但十分有效。 熵编码是纯粹基于信号统计特性的编码技术。它是一种无损编码,解码后能无失真地恢复原信息。熵编码的基本原理是给出现概率较大的符号一个短码字,而给出现概率较小的符号一个长码字,这样使得最终的平均码长很小。一个精心设计的熵编码器,其输出的平均码长接近信源的信息熵,即码长的下限。常用的熵编码方法有游程编码、霍夫曼编码和算术编码三种。游程编码主要用于量化后出现大量零系数的情形,利用游程来表示连零码,降低为表示零码所用的数据量。霍夫曼编码是一种不等长最佳编码方法。所谓最佳是指对于相同概率分布的信源这种编码的平均码长比其他任何一种有效编码的平均码长都短。霍夫曼编码必须知道信源的概率分布,这一般是无法做到的。通常采用对大量数据进行统计后得到的近似分布来代替实际的概率分布。 算术编码是20世纪80年代发展起来的一种熵编码方法,已渐渐受到人们的注意。它的基本原理是,任何一个数据序列均可表示成0和1之间的一个间隔,该间隔的位置与输入数据的概率分布有关。可以根据信源的统计特性来设计具体的编码器,也可以针对未知概型的信源来设计能够自适应适配其分布的算术编码器,并且这两种形式的编码器均可以用硬件实现。有关的实验数据表明,在未知信源概率分布的大部分情形下,算术编码要优于霍夫曼编码。上述三种熵编码方法均已被各种编码标准采纳。 预测编码有线性预测和非线性预测两类,它们可以在一幅图像内进行(帧内预测编码),也可以在多幅图像之间进行(帧间预测编码)。预测编码基于图像数据的空间和时间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。这些

文档评论(0)

喵咪147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档