03基于对象编码技术的MPEG-4.PPT

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
03基于对象编码技术的MPEG-4

10.3.3 MPEG-4核心编码技术-AV对象 AV对象是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。 MPEG-4对AV对象的操作主要有: 1.采用AV对象来表示听觉、视觉或者视听组合内容。 2.允许组合已有的AV对象来生成复合的AV对象,并由此生成AV场景。 3.允许对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据。 4.允许接收端的用户在AV场景中对AV对象进行交互操作。 5.MPEG-4支持AV对象知识产权与保护。 10.3.4 基于场景的对象分割与编码技术 MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。 MPEG-4的编码理念是:在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频,其过程如图所示。 10.3.5视频对象平面-VOP 我们根据人眼感兴趣的一些特性如形 状、运动、纹理等,将图像序列中每一帧中的场景,看成是由不同视频对象平面VOP (Video Object Plane)所组成,而同一对象连续的VOP称为视频对象VO。 VOP是视频场景的语法对象,除轮廓信息外,主要由亮度和,色度分量(Y,U,V)组成。VOP可以是任意形状,可由半自动分割来检测。 图10-14 为实现基于内容交互,人物由简单到复杂的轮廓物征提取 视频对象平面(VOP,Video Object Plane)是视频对象(VO)在某一时刻的采样,VOP是MPEG-4视频编码的核心概念。 图10-15 VOP视频编码技术 10.3.6 运动估计与运动补偿技术 MPEG-4采用运动预测和运动补偿技术来去除图像信息中的时间冗余成分,而这些运动信息的编码技术可视为现有标准向任意形状的VOP的延伸。VOP的编码有3种模式,即帧内(Intra-frame) 编码模式(I-VOP),帧间(Inter-frame)预测编码模式(P-VOP),帧间双向 (Bidirectionally)预测编码模式(B-VOP) 。 图10-16 MPEG-4的运动预测和运动补偿技术 10.4基于内容的信息存取与MPEG-7 10.4.1 MPEG-7概述 MPEG-7 的产生是为了解决上述问题,其重点在于影音内容的描述和定义,以有弹性、具延伸性、多层次及明确的数据结构和语法来定义影音数据的内容,经由 MPEG-7 的定义格式,使用者可以有效率地搜寻、过滤和定义想要的影音数据。 10.4.2 MPEG-7:基于信息内容的搜索引擎 MPEG-7是属于信息方面的检索和搜寻,而所谓信息,则可以是影像或音乐;换句话说,MPEG-7在本质上来说就是我们常常在网上使用的搜索引擎,只不过它提供的是多媒体的信息查询服务。 10.4.3 MPEG-7中的主要概念 数据(Data) 是用MPEG-7描述的视听资料,不考虑它们的存储、编码、显示、传输、媒介或技术。 特征(Feature) 指数据的特性。特征本身不能比较,而要用有意义的特征表示(描述子)和它的实例(描述值)。 描述子(Descriptor,D) 是特征的表示。它定义特征表示的句法和语义,可以赋予描述值。 描述值(Descriptor Value) 是描述子的实例。 描述模式(Description Scheme,DS) 说明其成员之间的关系结构和语义。 描述(Description) 一个描述由一个描述模式(结构)和一组描述值组成。 编码的描述(Coded Description) 是对已完成编码的描述,满足诸如压缩效率、差错恢复和随机存取的相关要求。 描述定义语言(Description Definition Language,DDL) 是一种允许产生新的描述模式和描述子的语言,允许扩展和修改现有的描述机制。 图10-18 MPEG-7应用的表示 10.4.4 MPEG-7的范围 MPEG-7是针对存储形式(在线、脱机)或流形式(如 Internet上的广播、推拉模型)的应用而制定的,并且可以在实时和非实时环境中操作。一个实时环境意味着当采集资料时,信息是与内容相关的。 下 图是MPEG-7处理过程的一种高度抽象示意图,用于解释MPEG-7的范围。它包括特征抽取(分析)、描述本身和搜索引擎(应用)。 10.5 H.261与H.263 H.261视频编码标准是CCITT(国际电报电话咨询委员会)的建议,这个建议支持实时动态图像的压缩编解码,

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档