图像编码读书笔记..docxVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图像编码读书笔记.

图像编码读书笔记一、图像编码的必要性和可能性数字图像通常要求很大的比特数,这给图像的传输和存储带来相当大的困难。要占用很多的资源,花很高的费用。因此,对图像数据进行压缩显得非常必要。原始图像数据是高度相关的,存在很大的冗余度,数据冗余造成比特数浪费,消除这些冗余可以节约码字,也就达到了数据压缩的目的。一般原始图像中存在很大的冗余度,包括结构冗余、心理视觉冗余和编码冗余,用户通常允许图像失真,降低输入的原始图像的分辨率对输出图像分辨率影响不大,用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息,提取有用的信息,使必须传输和存储的图像数据大大减少。二、图像编码的分类图像编码有四种方案:熵编码、预测编码、变换编码和混合编码。熵编码是基于信号统计特性的编码技术,是无损编码,其基本原理是给出现概率较大的符号赋予一个短码字,给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小,常见的熵编码有霍夫曼(Huffman)编码、算术编码、游程编码;预测编码是基于图像数据的空间或时间冗余特性,基本原理用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码,预测编码有帧内预测和帧间预测、差分脉冲编码、运动补偿法;变换编码是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低,变换后图像的大部分能量只集中到少数几个变换系数上,再采用适当的量化和熵编码就可有效地压缩图像;混合编码综合了熵编码、变换编码或预测编码的编码方法,常见的有JPEG标准,MPEG标准化。图像压缩编码还可分为无损压缩和有损压缩。三、图像压缩编码的评价1、基于压缩编码参数的评价编码效率:为图像信息熵,为平均码长,若与相等, 编码效果最佳压缩比:是对原始图像采用自然编码时的码长,是对图像压缩编码后的平均码长。2、基于保真度(逼真度)准则的评价客观保真度通常以均方根误差、均方根信噪比和峰值信噪比三种形式来表示。对于最终作为人的视觉感受使用的视觉图像,一般也采用主观保真度准则进行主观评价,包括综合评价法和成对比较打分法。电视图像质量评价的等级量表见下图:3、算法的适用范围特定的图像编码算法具有相应的适用范围,并不对所有的图像都有效。一般来说, 大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编码算法的适用范围较窄。例如,分形编码主要用于自相似性高的图像,基于对象的图像压缩编码方案只能用于特定的图像场景(如人的头肩场景)的压缩。4、算法的复杂度算法的复杂度是指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。优秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。四、JPEG算法JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为“.jpg”或“.jpeg”,是一种支持8位和24位色彩的压缩位图格式,是非常流行的图形文件格式。JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。而在JPEG算法中综合了运用了变换编码、预测编码、熵编码中的霍夫曼编码以及游程编码,所以对JPEG编码过程做简要分析。RGB格式转换为YUV格式 YUV与RGB相互转换的公式如下: Y = 0.299R + 0.587G + 0.114B U = -0.147R - 0.289G + 0.436BV = 0.615R - 0.515G - 0.100B R = Y + 1.14V G = Y - 0.39U - 0.58VB = Y + 2.03U2、将图像8*8分块 将原始图像转换为YUV格式后,对图像按一定的采样格式进行采样,常见的格式有4:4:4,4:2:2和4:2:0。取样完成后,将图像划分成8*8的块。3、离散余弦变换(DCT) 离散余弦变换DCT(Discrete Cosine Transform)是数码率压缩需要常用的一个变换编码方法。任何连续的实对称函数的付立叶变换中只含余弦项,因此余弦变换与付立叶变换一样有明确的物理意义。DCT是先将整体图像分成N*N像素块,然后对N*N像素块逐一进行DCT变换。由于大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对高频成分的失真不太敏感,所以可用更粗的量化。因此,传送变换系数的数码率要大大小于传送图像像素所用的数码率。到达接收端后通过反离散余弦变换回到样值,虽然会有一定的失真,但人眼是可以接受的。二维正反离散余弦变换的算式:其中N是像块的水平、垂直像素数,一般取N=8。N大于8时效率增加不多而复杂性大为增

文档评论(0)

sfkl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档