网站大量收购独家精品文档,联系QQ:2885784924

多媒体技术量化和变换编码和预测编码.pptx

  1. 1、本文档共93页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;;一个典型的信号压缩系统如图所示;一个典型的信号压缩系统如图所示。;一个典型的信号压缩系统如图所示。;一个典型的信号压缩系统如图所示。;一个典型的信号压缩系统如图所示。;一个典型的信号压缩系统如图所示。;量化之前需要规定量化级,比如8级,16级等 量化时将取样值与量化级比较,若取样值在某个量化级的覆盖区间之内,则规定它取这个量化级的代表值,我们称其为码字。 一个量化器只能取有限多个量化级,从而量化过程不可避免地会引起量化误差。 ;量化器定义 ;例如: 码本集:Y = {y1,y2,…,yN} ;量化可以分为两类: ;标量量化;;标量量化的输入/输出特性采用阶梯形函数的形式 ;输出代表点集Y = {y1,y2,…,yN} ;均方误差为 ; LBG算法;LBG算法;初始化,给定N, ε 0,假设初始码本及训练集分别为 ;LBG算法的局限性;;;为什么变换;为什么变换;现有图像/视频编码国际标准的基本框架都是采用预测、变换、熵编码等技术将图像/视频信号压缩成一定码率的码流,其核心技术之一是变换。 变换是对信号改造和加工的过程,它有助于去除信号中冗余(相关性)和实现信号能量集中,正是图像/视频编码技术的理论基础。 实际应用中通常采用正交变换。;; 图像/视频压缩处理中常用的变换包括: 离散傅里叶变换 DFT 离散余弦变换 DCT Karhunen—Loeve变换 KL 离散小波变换…… KL变换由于去除信号中的相关性最彻底,因而被称为“最佳变换”。但KL变换的基是不固定的,需要存储变换基,计算复杂性高,使得KL变换的应用不现实。;为什么变换 ;为什么变换; Karhunen—Loeve(KL)变换 以图像统计特性为基础的一种正交变换,也称为特征向量变换或主分量变换 KL变换的目的:去图像的相关性 相关性:用协方差矩阵度量 以下图像为例描述KL的算法 ;KL变换;KL变换;KL变换;;;;;;KL变换说明 Y向量的协方差矩阵Cy非对角线元素是协方差,协方差为零,表示向量分量间的相关性甚小,X向量的协方差矩阵Cx非对角线元素非零,说明相关强。;KL变换说明 KL变换后能量高度集中,压缩效果明显; KL变换是在最小方差意义下最优。 主要缺点: KL变换的矩阵计算复??,该矩阵不是固定不变的,而是随着输入图像的不同而改变, 没有通用的变换矩阵和快速算法;;定义;定义;定义;对于 有;;正变换;;;;其中;;;;垂直方向;垂直方向;垂直方向;垂直方向;;;;离散余弦变换(DCT)编码;;Example Calculating the DCT of X is 4×4 block of samples from an image:;余弦变换基图像;DCT transform;;;;JPEG (Joint Photographic Experts Group)是1986年制定的国际静态图像压缩标准, 采取的核心压缩算法是DCT算法(Discrete Cosine Transform)。 ;DCT算法在历史上起到了很重要的作用,一幅640×480的彩色图像,大小为3×640×480=921,600BYTE,使用64K/S的ISDN网络进行传输,大约需要1.9分钟。 JPEG压缩后大约38,400 BYTE,传输只需要4.8秒。;;尽管JPEG算法在过去和现在很多领域还发挥者巨大作用, 但由于算法是将整体图像分割成小块(8×8或16×16)进行变换,当压缩比高时由于数据损失,在块与块 之间就会出现分割的现象: ;; 预测编码:根据某一模型,利用信号以往的样本值对新样本值进行预测 , 对预测误差进行编码。 对于相关性较强的信号,如果建立合适的模型, 误差信号的幅值将远远小于原始信号,从而可以用较少的电平类对其误差信号量化得到较大的数据压缩效果。 ;问题:能否精确地预测数据源输出? 答案 : 否 数据源是不确定的 几乎没有一个实际的系统能找到可以精确预测输出的模型 能找到的最优预测模型是以某种最小误差意义下的预测模型。 ;对于静止图像,由于相邻像素具有很强的相关性,这样当前像素的灰度(颜色)值可用前面已经出现的像素值进行预测,得到一个预测值,对实际值与预测值的差值进行编码, 对于视频信号,图像帧间的相关性具有很强的相关性,通过帧间预测,对残差图像编码。 预测编码是当今主流技术并且还会流行于未来。;预测编码--PCM;预测编码--PCM;预测编码-- DPCM;预测编码-- DPCM;预测编码-- DPCM;预测编码-- DPCM;预测编码-- DPCM;;;;;;;;1、有时候读书是一种巧妙地避开思考的方法。

文档评论(0)

ayangjiayu13 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档