MPEG-7标准介绍.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MPEG-7标准介绍

第三章 MPEG-7标准介绍 MPEG-7[18]的正式名称为“多媒体内容描述接口”(Multimedia Content Description Interface)。其制定目标就是通过制定一组标准的描述符(Descriptor) 及其描述方案(Description Scheme)来为不同类型的多媒体信息提供一套描述多媒体内容数据的标准化工具集, 使得内容描述与媒体内容结合, 构造一个统一的、标准的多媒体检索平台来支持基于内容的快速、高效的检索, 满足实时、非实时以及推拉应用的需求。 本章介绍了MPEG-7目标和对象、体系结构、描述工具、描述定义语言及系统工具。 3.1 MPEG-7 目标和对象 MPEG-7标准的目的是要制定一种针对各类多媒体信息的描述标准。该描述与内容有关,并能够达到快速高效地搜索用户感兴趣的素材。无论描述的形式如何,描述都可以附在任何一种多媒体素材之后。具有此种附加信息的存储素材就可以被方便地索引和搜索了。尽管描述与被描述内容的表达方式无关,但在一定程度上还是依赖于标准,在该标准中提供了一种将声音图像内容作为在时间(同步)和空间(屏幕)上有一定联系的对象来编码的方法。定义的多媒体含义十分广泛,包括: 客观类:图像、图表、文本、三维模型、音频、语音、视频等。主观类:对对象/事件的概括、人的感性色彩等。合成类:各种元素之间的有机结合以构成一个真正意义上的多媒体演示。如人的面部表情、性格特征、以至一段电影的主题都是MPEG-7中的数据类型之一。为此,定义了标准描述子集合(Standard Set of Descriptors)用于描述各种类型的多媒体数据,与之相应的描述方案(Description Schemes)用于规范多媒体描述子的生成和不同描述子之间的有机联系。这些描述子与所指定的多媒体对象的内容紧密联系,采用提取对象特征的方法为实现基于内容的语义的准确检索提供了接口。在此基础上,定义了一种新的语言描述定义语言(Description Definition Language)用于指定和生成描述方案。和VHDL语言在超大规模集成电路应用中所扮演的角色一样,DDL语言是的核心。要充分地利用多媒体信息描述,特征(描述)的自动提取是十分有用的。但是根据MPEG一贯坚持的制定最少的、最有用的原则,主要集中在对便于多媒体信息分类的表达方法进行标准化。而特征提取算法、声音图像内容识别工具不属于标准的界定范围。同样搜索机制和音频或视频回放技术也不包括在标准中,而只确定描述与搜索机制之间的接口。开发声音图像内容识别工具、特征抽取工具、搜索和音频视频回放工具是工业界的任务,他们会生产销售符合的产品。符合标准的描述可以是手工输入的,也可以是自动提取的,标准中对此并不作规定。但某些特征最好自动提取(如色彩、纹理),但另一些特征则很难甚至不可能自动提取,所以要根据描述的内容和层次来决定。可以独立于其它MPEG标准使用,例如符合标准的描述甚至可以附在非数字模拟影片之后。但是标准也利用了MPEG-4标准提供的用对象来描述声音图像数据的方法,这一表达方法是多媒体信息分类过程的基础。同时,描述又可以帮助改进以往MPEG标准编码的性能。所以各MPEG标准是相互独立又相互联系的。 图3-1 MPEG-7 各部分关系图 图3-1显示了上面介绍的MPEG-7各个部分的关系。DDL定义了MPEG-7的描述工具——描述符和描述规范,提供了将描述符转化成描述规范形式的方法。必要时,DDL也允许扩展特殊的描述规范。由于DDL建立在XML规范上,描述工具示例使用文本模式(XML)。二进制形式的获得是通过定义在系统部分的BIM得到的。 通过手工或半自动的提取,可以得到视听形式的多媒体内容的描述。音视频的描述可以直接存储或传送。如果我们考虑客户端主动提出要求的环节,客户端提交需求给搜索引擎,收到一套匹配的描述进行浏览(仅是为了检查、操作、重现描述内容)。对于服务端主动发给客户端的环节,过滤器将会从得到的描述中进行选择,进行程序操作(如转换广播通道或记录描述数据)。在这两种环节中,所有的指令可以以MPEG-7的形式操纵描述编码,只有在显示一致点时需要MPEG-7结构(当它们作为信息服务器和信息用户应用时显示的界面)。MPEG-7的重点在于提供了音视频数据描述的新的方法。 3.3 MPEG-7 描述工具 描述工具是MPEG-7中最重要的部分,可以分为三个功能块:多媒体描述规范(MDS)、视频和音频。 多媒体描述规范 描述规范提供了XML中与AV内容的描述相关的重要概念。采用标准化的描述方式使查询、检索、过滤和访问操作变得灵活。描述结果能以文本的形式(如便于编辑、查询和过滤的XML形式)表示或压缩为二进制形式(便于存储或传送)。MPEG-7指定了四种标准元素:描

文档评论(0)

专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!

1亿VIP精品文档

相关文档