数字视频压缩编码要点.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字视频压缩编码 数据压缩的必要性 庞大的数据量要求人们必须对数据进行压缩 例:存储一幅352×288的静态真彩色图像需要的存储空间: 352×288×3B=304.13kB 真彩色色彩深度24bit,即3个字节 例:计算1分钟视频所需的存储空间。分辨率为352×288,每秒25帧,不含音频数据 304.13kB×25×60=456195kB=445.5MB 数据压缩的可能性 能够对多媒体信息进行压缩的前提就是因为数据中存在大量的冗余,尤其是声音和图像; 数据压缩的目的就是尽可能的消除这些冗余; 冗余的类型 在静态图像中存在空间冗余 一幅图像中有较大的背景区域,在此区域中所有的点具有相近的物理特性(亮度、颜色等),这种空间的连贯性就称为空间相关或空间冗余。 在视频序列中存在时间冗余 视频序列中相邻的帧往往包含相同或类似的背景和运动物体,只不过运动物体所在的空间位置略有不同。这种相邻帧间数据的高度相关性就称为时间冗余。 冗余的类型 信息熵冗余 信息熵冗余也称为编码冗余,由香农定理可知,为表示图像数据的一个像素点,只要按其熵的大小分配相应的比特数即可。而对于实际图像数据的每个像素,在图像获取时很难得到它的熵,因此,一般是对每个像素采用相同的比特数来表示,这样就必然存在冗余,这种冗余称为信息熵冗余。 冗余的类型 视觉冗余 人眼的视觉特性 知识冗余 先验知识和背景知识 结构冗余 指视频图像中存在很强的纹理结构或自相似性 去除冗余的方法 空间冗余的消除 基于预测的方法:帧内预测 正交变换的方法 时间冗余的消除 基于预测的方法:帧间预测 编码冗余的消除 熵编码 数据压缩的方法 无损压缩 压缩时不损失任何信息,解压时可以完全恢复成原来的数据; 利用原始信息中的相关性进行的数据压缩不损失原信息的内容,可实现无损压缩 统计式:Huffman编码、算术编码(AC)、行程编码(RLC);字典编码(LZW) 数据压缩的方法 有损压缩:数据压缩后不能将原来的文件信息完全保留的压缩; 在很多情况下,数据压缩还原过后允许有一定的损失,不过应当能基本表述原信息的内容,否则没有意义; 依据:在原始信息中存在一些对用户来说不重要、不敏感、可以忽略的内容; JPEG、MPEG 图像压缩方法 视频编码技术 主流的编码技术是以宏块为单位进行编码,将每帧图像划分成若干宏块,按照从上到下,从左到右的顺序对每个宏块进行处理。 预测编码 预测编码是消除视频冗余的重要编码工具之一,针对空间冗余有帧内预测编码(intra-prediction),对于时域冗余有基于运动估计技术的帧间预测编码(inter-prediction)。 预测编码利用信号间的相关性,用前面一个或多个信号作为当前信号的预测值,对当前信号的实际值与预测值之差进行编码。 帧内预测编码 帧内预测利用图像在空间上相邻像素之间具有相关性的特点,由相邻像素预测当前块的像素值,可以有效的去除块间冗余。 帧内预测包含多个预测方向,按照图像本身的特点选择一个最佳的预测方向,最大限度地去除空间冗余。 帧内预测编码 DPCM系统的基本原理 DPCM(Differential Pulse Code Modulation,差分脉冲编码调制) 帧内预测编码 DPCM系统的基本原理 接收端恢复的输出信号 和发送端输入的信号 的误差是 可见,输入输出信号之间的误差主要是由量化器引起的。 帧内预测编码 预测模型 设 时刻之前的样本值 , ,…, 与预测值之间的关系呈现某种函数形式 线性预测编码器 非线性预测编码器 帧内预测编码 在图像数据压缩中,常用如下几种线性预测方案: 前值预测,即 一维预测,即采用同一扫描行中前面已知的若干个样值来预测 二维预测,即不但用同一扫描行中的前面几个样值,而且还要用以前几行扫描行中样值来预测 举例如下 帧间预测编码 运动图像邻近帧中的场景存在着一定的相关性,因此,可为当前块搜索出在邻近参考帧中最相似的预测块,并根据预测块的位置,得出两者之间的空间位置的相对偏移量,即运动矢量。 通过搜索得到运动矢量的过程称为运动估计。 根据运动矢量,从指定的参考帧中找到预测块的过程称为运动补偿。 帧间预测编码中的运动补偿 最简单的时域预测就是用前一帧作为当前帧的预测参考帧。 一个视频序列里两个相邻帧如右图所示。 第一帧作为第二帧的参考帧,残差是第二帧与参考帧之差。 帧间预测编码中的运动补偿 在右图中,中间灰度代表差值为零,浅灰和深灰分别对应正、负差值。这种简单预测的明显问题是残差帧

文档评论(0)

x5511167 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档