- 1、本文档共269页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字电视原理余兆明 西电版)第5章 视频压缩编码标准
5.1 视频压缩编码标准的发展历程 5.2 H.261标准 5.3 JPEG标准 5.4 MPEG-1标准5.5 MPEG-2标准 5.6 H.263建议 5.7 MPEG-4标准 5.8 H.264标准 习题 VLBV核心支持的专用功能包括: (1) 实时多媒体应用: 支持矩形图像序列的有效编码,具有高编码效率、高精度、高容错度、低延时等特点。 (2) 多媒体数据库应用: 支持多媒体数据库的存储、随机存取以及FF/FR(快进/快退)等功能操作。 图5.7.1左上方的是MPEG-4的高比特率核——HBRV core(Higher Bit Rate Video core)。它提供了64 kb/s~4 Mb/s的高比特率图像传输的工具和算法。这些工具和算法与VLBV core所提供的是相同的。HBRV core的主要应用对象是多媒体广播、数字电视图像级别的交互信号传递。 在选择算法工具时,专家们对MPEG-4进行了大量的核心实验: 对于运动估计,试验了全局运动补偿、2D三角网格预测和亚像素预测; 对于帧纹理编码,比较了小波变换、3D-DCT、重叠变换、高级的帧内编码和可变块尺寸的DCT; 对于形状编码,验证了几何变换、形状自适应区域分割和可变块尺寸分割; 对于任意形状区域纹理编码,研究了贴补DCT、形状自适应DCT、延拓/内插DCT、小波/子带编码和中值替换DCT; 对于误差的坚韧性,尝试了重新同步、分层结构和误差掩盖,以求进一步改进甚低码率视频编码的质量。 这里需要说明的是,MPEG-4与MPEG-1/2的不同之处在于,MPEG-1/2中输入、进行编码的图像区域是标准矩形区域,而MPEG-4可以是任意形状区域。如果MPEG-4中输入的图像序列没有分解成一系列不同形状的VOP,而是传统的矩形区域,MPEG-4就不必对VOP的形状信息进行编码,那么该编码过程就和MPEG-1/2一样了。图5.7.2就说明了这一点。 图 5.7.2 MPEG-4甚低码率编码与通用编码 由此可以看出,MPEG-4的“基于内容”的编码方法可以看做是MPEG-1/2编码方法的扩展。 为了高效地降低图像信号的时间冗余度,MPEG-4使用了基于块的运动估值和补偿技术。它主要采用三种图像类型: (1) I-VOP(Intra VOP),它是不采用基准图像的编码而产生的图像。 (2) P-VOP(Predicted VOP),它采用上一个 I-VOP 或上一个P-VOP来进行运动补偿预测。 (3) B-VOP(Bidirectionally-Predicted VOP),它同时采用前面和后面的I-VOP或P-VOP 作基准,进行运动补偿预测编码。 三种图像帧结构关系如图5.7.3所示。 图 5.7.3 帧结构关系示意图 为了提高传输效率,MPEG-4采用了“子图形”预测和编码技术,它把静止的背景作为“子图形”,首先发往接收端,作为第一帧同时存储于编码器与解码器内,再利用摄像机的移动、旋转和缩放,摄取背景前出现的视频对象,再将其分开进行编码,形成视频序列进行传送,进而实现重建原来的图像。这种技术对实现多媒体数据库十分有利,可以改善图像质量。 对于其它MPEG-4的新技术,譬如图像填补技术等,由于篇幅所限,这里就不详述了。 总之,MPEG-4标准的提出,特别是它的“基于内容”的思想,极大地推动了多媒体交互业务的发展,为更多、更新的交互业务开拓了广阔的空间。下面作进一步分析。 1. 形状编码 MPEG-4引入了形状编码,尽管形状编码在计算机图形学、计算机视觉和图像压缩领域不是什么新技术,但将其纳入完整的视频编码标准内,这还是第一次。 VO的形状信息有两类: 二值形状信息和灰度形状信息。二值形状信息用0、1来表示VOP的形状,其中0表示非VOP区域,1表示VOP区域。二值形状信息编码采用基于运动补偿块技术,可以是无损或有损编码。灰度形状信息用0~255之间的数值来表示VOP的透明度,其中0表示完全透明(相当于二值形状信息中的0),255表示完全不透明(相当于二值形状信息中的1)。灰度形状信息的编码采用基于块的运动补偿DCT方法(同纹理编码相似),属于有损编码。目前标准中采用矩阵的形式来表示二值或灰度形状信息,称之为位图(或阿尔法平面)。实验表明,位图表示法具有较高的编码效率和较低的运算复杂度。但为了能够进行更有效的操作和压缩,在最终的标准中可能出现另一种表示方法,即借用高层语义的描述,以轮廓的几何参数进行表示。 2. 运动信息编码 类似于现有视频编码标准,MPEG-4采用运动预测和运动补偿技术去除图像信息中的时间冗余度,而这些运动信息的编码技术可
文档评论(0)