- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体技术量化和变换编码和预测编码 幻灯片
本单元的内容 量化 变换编码 预测编码 本单元的内容 量化 变换编码 预测编码 量化器定义 标量量化 标量量化 LBG算法 LBG算法的局限性 本单元的内容 量化 变换编码 预测编码 为什么变换 变换是信号实现时域和变换域(频域)映射关系的运算 通常经正变换将信号在变换域分解,然后由反变换重建信号: 当 有 为什么变换 变换的本质就是将信号在一组基函数上投影,得到一组投影值,即信号的变换域表达。 变换的目的就是将一个实际的物理信号分解为变换域(频域)上有限的或无限的小的信号“细胞”,以便了解信号的性质,提取信号的有用信息 现有图像/视频编码国际标准的基本框架都是采用预测、变换、熵编码等技术将图像/视频信号压缩成一定码率的码流,其核心技术之一是变换。 变换是对信号改造和加工的过程,它有助于去除信号中冗余(相关性)和实现信号能量集中,正是图像/视频编码技术的理论基础。 实际应用中通常采用正交变换。 为什么变换 图像/视频压缩处理中常用的变换包括: 离散傅里叶变换 DFT 离散余弦变换 DCT Karhunen—Loeve变换 KL 离散小波变换…… KL变换由于去除信号中的相关性最彻底,因而被称为“最佳变换”。但KL变换的基是不固定的,需要存储变换基,计算复杂性高,使得KL变换的应用不现实。 为什么变换 图像/视频压缩处理中常用的变换 人们发现在信号满足一阶马尔科夫过程时,DCT是KL变换的很好的逼近。 DCT有固定的基与明确的物理含义,使得DCT广泛应用于图像/视频压缩,成了变换编码的主要工具。 静止图像压缩编码的国际标准JPEG和视频编码标准H.264都采用了DCT变换编码 为什么变换 变换通过将信号的能量集中在少数变换系数上给出信号的紧致表达,便于后续的压缩处理。 对于图像而言,采用符合人的视觉系统特征的量化方式,大多数高频系数在量化后会很小或者为零,量化后的变换系数矩阵变成了一个稀疏矩阵。 选择适当的扫描方式将二维矩阵表示的系数表示为一维向量,使得一维向量表示的系数具有零系数连续出现的特点,这样通过行程编码可以得到高压缩比。 KL变换 Karhunen—Loeve(KL)变换 以图像统计特性为基础的一种正交变换,也称为特征向量变换或主分量变换 KL变换的目的:去图像的相关性 相关性:用协方差矩阵度量 以下图像为例描述KL的算法 KL变换 一幅256×256图像分成1024个8×8的块 每个8×8的块按照行(或列)的顺序排成一个64维 的向量 向量 的维数 定义随机向量 使得其取值范围为 KL变换 KL正变换 KL逆变换 A是正交矩阵,mx是向量X的平均值 KL变换 KL正变换 KL逆变换 A是正交矩阵,mx是向量X的平均值 KL变换说明 Y向量的协方差矩阵Cy非对角线元素是协方差,协方差为零,表示向量分量间的相关性甚小,X向量的协方差矩阵Cx非对角线元素非零,说明相关强。 KL变换说明 KL变换后能量高度集中,压缩效果明显; KL变换是在最小方差意义下最优。 主要缺点: KL变换的矩阵计算复杂,该矩阵不是固定不变的,而是随着输入图像的不同而改变, 没有通用的变换矩阵和快速算法 正变换 U=Tu 反变换 u=T-1u=UTu 离散余弦变换(DCT)编码 余弦变换基图像 JPEG (Joint Photographic Experts Group)是1986年制定的国际静态图像压缩标准, 采取的核心压缩算法是DCT算法(Discrete Cosine Transform)。 DCT算法在历史上起到了很重要的作用,一幅640×480的彩色图像,大小为3×640×480=921,600BYTE,使用64K/S的ISDN网络进行传输,大约需要1.9分钟。 JPEG压缩后大约38,400 BYTE,传输只需要4.8秒。 尽管JPEG算法在过去和现在很多领域还发挥者巨大作用, 但由于算法是将整体图像分割成小块(8×8或16×16)进行变换,当压缩比高时由于数据损失,在块与块 之间就会出现分割的现象: 本单元的内容 量化 变换编码 预测编码 预测编码:根据某一模型,利用信号以往的样本值对新样本值进行预测 , 对预测误差进行编码。 对于相关性较强的信号,如果建立合适的模型, 误差信号的幅值将远远小于原始信号,从而可以用较少的电
文档评论(0)