- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于MPEG4数字视频压缩技术研究
基于MPEG4数字视频压缩技术研究
MPEG-4除了针对一定比特率下的音频、视频码外,它还更加侧重于多媒体系统的灵活性以及交互性,MPEG-4对于传输的速率要求不高,所需的带宽也很窄,它的数据的压缩和传输都是利用帧重建技术来实现的,因此可以利用最少的数据获取最好的图像质量。本文就对MPEG-4的数字视频压缩技术做出研究。
MPEG-4 数字视频 压缩技术
一、MPEG-4的构成
1.DMIF。DMIF为多媒体传送框架,其主要作用是解决广播环境、磁盘应用以及交互网络中的应用多媒体的操作问题,其服务器端与客户端的传输和接口是利用传输多路合成比特信息建立的。借助于DMIF,MPEG-4就能建立一个可以面向每个基本流的带宽,以及一个有特殊品质服务的信道。
2.数据平面。MPEG-4的数据平面共有两个部分,即媒体关系以及传输关系。为了保证在同一场景中同时出现AV对象以及基本流,MPEG-4引用了SMT(流图桌面)以及OD(对象描述)的概念。和特殊AV对象有关的基本流信息流图通过对象描述传输,而SMT则把一个CAT与每个流相连接,利用CAT实现流图的传输。
3.实时识别与缓冲区管理.SDMMPEG-4所定义的一个系统解码模式,其所描述的是一种解码装置,是一种比较理想的处理比特流句法语义的装置,它要求特殊的实时模式以及缓冲区。
4.音频编码。MPEG-4最大的优点就是它不但支持自然声,还支持各程合成声音。MPEG-4的音频部分把自然声编码与音频合成编码进行结合,而且支持音频对象特征。
5.视频编码。和音频编码一样,MPEG-4也支持自然视觉对象与合成视觉对象的编码,一般2D和3D动画以及人的面部表情等都属于合成视觉对象。
6.景描述。在MPEG-4中,有一系列的工具用于组成场景的一组对象。场景描述就是由其中必要的合成信息组成,这些场景描述的格式通常以二进制格式BIFS来表示,它和AV对象一起编码和传输。场景描述的作用主要是描述AV有在具体的AV场景坐标下,怎样组织和同步等。
二、MPEG-4的主要编码结构
1.形状信息编码。形状信息编码是第一次被纳入视频编码标准。MPEG-4中的编码形状信息有两种,即灰度形状信息以及二值状信息。其中二值形状信息指的是编码的VOP形状采用的是0,1的方法来表示,0代表非VOP形状区域,1代表VOP区域。而灰度形状信息是指VOP的透视程度采用0到255间的数据表示,其中0与二值形信息的0相同,也是代表非VOP形状区域,而255则与二值形状信息的1相同,代表不透明区域,1-255等数字所代表的是不同透明程度的形状区域。灰度形状信息可以表现透视物体,当前景物体与背景相叠加时,边界不会太明显,经过“模糊”处理就可以减少混迭的现象。把VOP用一个16*16整数倍的边框框住,并在框内再分多个长宽为16的宏块,就可以用边框矩阵表示VOP,取值0,1或者0-255,VOP形状信息编码即可转换为边框矩阵编码。
2.运动信息编码。MPEG-4利用运动预测以及运动补偿除去视频帧间时间冗余,这种运动信息编码技术从某种意义上来说,也可以看做是现有标准向任意形状VOP的延伸。MPEG-4中的运动补偿和运动预测可以基于8*8的像素宏块,也能基于16*16的像素宏块。MPEG-4还引入了多边形匹配以及图像填充等技术,来更好地适应任意形状VOP。可以利用传统基于块的运动预测以及补偿技术,对标准宏块进行运动预测和运动补偿。对于在VOP边界轮廓宏块,就要利用灰度值对轮廓宏块中边界以外的像素进行填充,即图像填充技术,再利用多边形匹配进行运动预测及运动补偿。具体来说,图像填充技术是由OVP内部像素值推出外部像素值,从而获取运动估计的参考值。多边形定义出轮廓宏块内处于VOP内部的部分,将VOP外部的像素排除。运动预测只是针对多边形所定义的、处于VOP活动区域内的像素。
把当前宏块和找到的最佳匹配块运动矢量(运动偏移)以及残差(匹配误差)进行传输,当做运动补偿时,把该匹配误差和运动偏移和经过重构的预测帧相加,就可以得出当前帧的重构帧,这个过程大幅度减少了信息传输量,从而实现有效压缩的作用。
3.纹理编码。视频的纹理信息通常用两个色差成分Cb、Cr以及亮度Y来表示。帧内环境中纹理信息直接包括色差和亮度成分,而在运动补偿情况下纹理信息则表示运动补偿后的匹配误差。不管理帧内编码模式还是帧间编码模式,或者运动补偿后的残差,都可以作为纹理编码的对象。其编码方法一般还是利用8*8像素宏块的DCT方法。处于帧内编码模式时,如果像素块完全处于VOP内,可以采取经典DCT方法,如果像素块位于VOP之外则不用进行编码,如果像素块一部分在VOP外另外一部在VOP内部,则可以先利用图像填充获得
原创力文档


文档评论(0)