图像与视频编解码技术-revised.docVIP

下载本文档

253
0
约3.03万字
约 40页
2018-02-23 发布于河南
举报
版权申诉

图像与视频编解码技术-revised.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

图像与视频编解码技术-revised

目录摘要 2 第一部分概述 3 一、图像/视频编码的必要性与可行性 3 1.编码的必要性 3 2.编码的可行性 3 二、图像/视频编码的关系 4 三、图像/视频编码的评估 4 第二部分静止图像编解码技术 6 一、静止图像编解码中的主要方法与技术 6 1.熵编码 6 2.源编码 8 3.量化 10 二、小波图像编码与分形图像编码 11 1.小波图像编码 11 2.分形图像编码 13 三、国际标准JPEG与JPEG2000 14 1.JPEG 14 2.JPEG2000 15 第三部分视频编解码技术 18 一、视频编码国际标准 18 1. MPEG-1 18 2. MPEG-2 20 3. MPEG-4 20 4. MPEG-7与MPEG-21 22 5. H.261 23 6. H.263 24 7. H.264 24 二、视频编码中的一些特殊技术 30 1.运动估计技术 30 2.差错纠正技术 32 第四部分与手持设备相结合的视频编解码 35 一、无线网络环境 35 二、手持移动计算设备的特点 36 三、视频国际标准之间的比较与相关思考 36 参考文献 38 摘要视觉是人类获取信息的主要途径，图像与视频在人与计算机的交互过程中扮演着重要的角色。随着编解码技术的不断发展，与图像和视频相关的电子产品正逐步进入普通人的生活并变得越来越不可或缺。近年来，以手机为代表的手持移动计算设备正日益成为普通人工作生活中的一部分，越来越多的用户希望能够通过手机点播视频节目甚至是进行可视通话。为满足这些需求必须去研究与手持设备相关的视频编解码问题。本文是对视频编解码学习的一个总结，主要介绍了视频编解码和与其关系十分密切的图像编解码中的相关技术与国际标准，其中重点介绍了新的视频国际标准H.264中的技术方法与特性，并在最后对手持设备上视频编解码的特殊性以及视频编解码技术可能的发展方向做了一些思考和探讨。关键词：视频编解码，图像编解码，H.264，手持设备第一部分概述一、图像/视频编码的必要性与可行性 1.编码的必要性 21世纪的人们面临的是一个信息化的社会。数字化后的信息，尤其是数字化后的图像和视频信息具有数据海量性，这给信息的存储和传输造成了较大的困难，成为阻碍人类有效的获取和使用这此信息的瓶颈问题之一。因此，研究和开发新型有效的多媒体数据压缩编码方法，以压缩的形式存储和传输这些数据将是最好的选择。原始彩色图像本身数据量相当巨大，以一幅普通的1024*768的图片为例，如果对RGB三个分量都进行了256级量化，占用一个字节，就是说使用24位bmp位图格式而完全不进行压缩的话，其数据文件大小为1024*768*24=18Mbit。再以陆地卫星（Land sat—3）为例子，其水平、垂直分辨率分别为2340和3240，四波段采样精度7位，它的一幅图像的数据量为2340×3240×7×4=212Mbit，按每天30幅计每天数据为212×30=6.36Gbit，每年的数据量高达2300Gbit。这么大的数据量无疑给存储器的存储容量、通信干线的信道传输率以及计算机的运算速度都增加了极大的压力。单纯用扩大存储容量，增加通信干线的传输率是不现实的，数据压缩是行之有效的方法。 2.编码的可行性有意义的、可被人理解的图像中存在着很多冗余信息，因此对图像/视频进行数据压缩是有可能的。通过人们多年的研究与实践证明，这种冗余不仅存在而且占了原始数据中的绝大部分。也就是说，通过精心设计压缩算法，人们可以用极少量的信息精确表示原始的海量信息。图像/视频中的冗余信息主要包括统计冗余、结构冗余、知识冗余和视觉冗余等几类：统计冗余：统计冗余包括信息熵冗余、空间冗余和视频中的时间冗余。在把图像看成完全无意义的比特流后，按照信息论的有关原理，对该比特流只需按其信息熵的大小分配相应比特数即可完全精确的表示之。结构冗余：在有些图像的部分区域内存在着非常强的纹理结构，或是图像的各个部分之间存在有某种关系，例如自相似性等，这些都是结构冗余的表现。知识冗余：在有些图像在包含的信息与某些先验的基础知识有关，例如在一幅人头部特写的图像中，头、眼、鼻和嘴的相互位置关系属于一般常识，这种冗余称为知识冗余。视觉冗余：人类的视觉系统对于图像的注意是非均匀和非线性的，并不是对于图像中的任何变化都能感知。这种由于人眼特性产生的冗余称为视觉冗余。上述各种形式的冗余，是压缩图像与视频数据的出发点。图像与视频编码的目标就是要尽可能消除这些冗余信息，以减少表示图像与视频所需的数据量。二、图像/视频编码的关系图像编码与视频编码有着非常密切的关系。图像编码是视频编码的基础，视频可以看成是一个连续的静止图像的序列，研究如何对静止图像进行有效的编码对视频编码的研究有着至