- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 视频编码技术 1.视频信号的数字化 2.视频文件格式 3.视频压缩编码原理 4.视频压缩标准 学习目标 3.1 视频信号的数字化 帧:一帧是扫描获得的一幅完整图像的信号,是视 频图像的最小单位;“帧”在动画创作当中又称 “格”。 帧率:就是每秒钟扫描多少帧。对于PAL制式电视 系统,帧率为25帧;而NTSC制式电视系 统,帧率为30帧。 场:视频的一个扫描过程。有逐行扫描和隔行扫 描,对于逐行扫描,一帧即是一个垂直扫描 场;对于隔行扫描,一帧由两场构成:奇数场 和偶数场,是用两个隔行扫描场表示一帧。 (1)逐行扫描 (2)隔行扫描 但数字视频的数据量是非常惊人的,按照ITU-R601标准4∶2∶2格式的PAL制数字化视频信号,每帧数据量为720×576×8×2≈6.64Mbit,每秒数据量为6.64×25≈165Mbit。 视频信息和信号特点: (1) 直观性:给人印象更深刻、生动、具体。 (2) 确定性:“百闻不如一见”。 (3) 高效性:人眼是一个高度复杂的并行信息处理系 统,能并行快速地观察一幅图像的细节,因此它获取视 频信息的效率要比语音信息高得多。 (4) 广泛性:人类接受的信息,80%来自视觉。 3.2 数字视频文件格式 3.2 数字视频文件格式 3.2 数字视频文件格式 3.2 数字视频文件格式 3.2 数字视频文件格式 3.2 数字视频文件格式 3.3 视频压缩编码 视频数据之所以能被压缩,是因为在视频数据中存在着大量的冗余信息。 视频数据主要存在下列冗余: (1)空间冗余,同一帧图像中相邻的像素具有很强的相关性。 (2)时间冗余,图像序列中相邻帧的对应像素具有很强的相关性。 (3)结构冗余,在视频图像的纹理区,像素的亮、色度信息存在着明显的分布模式,如果知道了分布模式,就可以通过某种算法来生成图像,即存在结构冗余。 3.3 视频压缩编码 3.3.1 预测编码 1. 预测编码的基本内容 预测编码是基于图像数据的时间和空间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。 这些相邻像素(或图像块)可以是同行扫描的,也可以是前几行或前几帧的,相应的预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预测是帧间预测,即在时间轴上用前一帧的像素(或图像块)对后一帧的像素(或图像块)进行预测。 2. 预测编码的类型 预测编码分线性预测和非线性预测两类,线性预测编码又称为差分脉冲编码调制,即DPCM(Differential Pulse Code Modulation)。 DPCM系统又称预测量化系统。 差分脉冲调制预测——原理图 差分脉冲调制预测 发送端预测器带有存储器,把tn时刻以前的采样值x1, x2, x3, xn-1存储起来并据此对xn进行预测,得到预测值 dn为xn与 的差值,dn’为dn经量化器量化的值 xn’是接收端的输出信号 误差qn为 qn=xn- xn’= xn-( +dn’)=(xn- )- dn’= dn- dn’ 实际上就是发送端的量化器对误差量化的误差 对 dn’的量化越粗糙,压缩比越高,失真越大 差分脉冲调制预测——应用示例 例如,取一序列为10,12,14,16,18,20。(例如亮度变化缓慢的图像的亮度值)由于其中所有数字都不相同,但是是一个等差的数列,所以行程编码和哈夫曼对其不产生压缩效果。 先用DPCM方法,其预测器的预测参数为 =Xn-1,则其误差值得到一个新的序列10,2,2,2,2,2。然后再使用行程编码方法对这个新序列进行压缩,压缩结果为10(5,2)。 差分脉冲调制预测 适用于输入数据为平稳的随机过程 预测器设计是预测编码系统的核心,预测器的复杂程度与线性预测中使用以前的样本数有关,样本数越多,预测器越复杂 对预测误差的量化是造成图像质量下降的主要原因,表现为: 斜率过载:图像轮廓变模糊 颗粒噪声:图像在平坦区出现颗粒状的细斑 边缘忙乱:在变化不快的边缘出现闪烁不定现象 伪轮廓:在图像亮度值缓慢变化区域出现伪轮廓 3. 双向预测 前向预测:就是用K-1帧来预测K帧图像。 后向预测:用K帧预测前面的K-1帧图像。 双向预测:用前、后两帧来预测中间帧图像。 (1)I帧 I 帧采用类似JPEG的编码方式实现。它不以任何其他帧做参考帧,仅仅进行帧内的空域冗余压
文档评论(0)