- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种多媒体信息系统设计与研究
一种多媒体信息系统的设计与研究
摘要:本文介绍一种基于MPEG-7多媒体信息系统,系统应用MPEG-7标准、动态模板技术、XML及XML数据库技术,实现对文本和视频等多种媒体的统一描述和集成管理,可对音像资源进行分段描述,并根据单实例的网状关系进行可视化的语义联想导航检索。
关键词:多媒体信息系统 MPEG 可视化检索
中图分类号:G354.4 文献标识码:A 文章编号:1007-9416(2011)06-0153-03
1、引言(概述)
随着计算机技术、网络技术和压缩技术的不断扩展。信息媒体的表达、生成、传播和存储有了突飞猛进的发展。许多研究机构已着手研究开发多媒体信息检索系统。建立网络多媒体信息检索系统需要解决如何组织多媒体信息, 如何实现人机交互, 如何存储和传送多媒体信息等诸多问题。多媒体信息包括文字、图像、音频、视频等多种不同的媒体形式, 相应的需要有不同的检索、处理、传送方式。
计算机多媒体技术是一门新兴的技术,多媒体技术与计算机、网络技术、通信技术、数字技术的结合,使得期刊出版工作过程和学术科研等多种信息传播不受时间、地点、国界、环境等的限制,这将有利于提高世界信息的流通速度,促进远隔重洋的各民族文化科技的及时交流。
多媒体信息现已成为计算机信息处理系统的主要数据资源,如何对这些信息关联度大、结构复杂、媒体处理要求高的多媒体数据进行有效的管理和使用,成为多媒体信息系统的一大技术难题。
目前,多媒体技术正向三个方面发展:一是计算机系统本身的多媒体化;二是多媒体技术与点播电视、智能化家电、识别网络通信等技术互相结合,使多媒体技术进入教育、咨询、娱乐、企业管理和办公室自动化等领域;三是多媒体技术与控制技术相互渗透,进入工业自动化测控等领域[1]-[2]。
2、多媒体信息系统的相关技术研究
传统的基于文本的检索方法采用对多媒体建立关键词等文本描述信息的方式已经无法满足多媒体检索的要求,主要原因在于: (1)人工标注工作量太大; (2)人工标注的主观性无法清晰描述多媒体信息的丰富语义[3]。因此,为了突破基于文本检索方式的弊端,提出了基于内容的检索方法。基于内容的检索方法自动或半自动的抽取图像(视频) 的色彩、纹理、形状、运行等内容特征,对象之间的空间关系以及场景、行为、情感等语义特征建立图像(视频) 的索引,计算查询图像(视频) 和目标图像(视频) 的相似距离,按相似度匹配进行检索。不同于基于文本的精确性检索方式,基于内容的检索方式是一种相似性检索,检索目标可能包含一些不相关的图像(视频) ,但更重要的是在检索中不要将相关的图像(视频) 漏掉[4]。
基于内容的视频检索提供给用户的检索方式大致归为四类: (1)导航;(2)基于关键字或概念查询; (3)基于范例或草图查询; (4)基于结构关系图查询。目前的视频分析和检索系统只能支持特定种类的检索方式,每种方式各有利弊,结合使用多种查询方法既可以表达丰富的语义含义,还可以消除歧义,因此更好地解决办法是设计一个通用的系统框架支持所有的检索方式,这是一个成功的视频检索系统必不可少的。通用系统框架必须具有开放、可扩展和互操作的特性,需要解决三个问题:功能的分解和封装;内容索引的表示;分布式体系结构。组件提供了统一的表示和设计类的方法,具有很好的封装性。框架用于集成分布式组件(应用服务器就属于这种框架) ,构成分布式应用模型。Web 服务体系结构也是一种框架,具有分布式体系结构的所有优点,同时它以XML 为基石,有更好的开放性和互操作性。MPEG7 是一种国标标准, 以XML 语言为载体,使用层次或图的结构化方法来描述多媒体内容信息。
2.1图像检索技术
随着信息数字化技术和多媒体技术的广泛应用, 大量信息都在以多媒体信息的方式被数字化。图像是最为广泛和基本的多媒体信息, 因而,对图像检索已成为当今计算机领域的研究热点。图像检索大致经历了两个发展阶段, 第一阶段是以关键字为基础的图像检索。第二阶段是以图像的自身内容为基础的检索。基于关键字的图像检索技术是人工将图像的内容标注为一系列的关键字, 通过这些关键字对图像进行检索。这种方法原理较为简单, 但是由于图像内容极其丰富, 难以用文字表达清楚, 很难达到准确检索的目的[5]。鉴于以上原因, 人们提出了基于内容的图像检索CBIR, 即对图像内容的视觉特征如颜色、纹理、形状等进行检索, 通过对图像视觉特征和上下文联系的分析, 提取出图像的内容特征作为索引来实现较高层次上的图像检索。
2.2多媒体内容描述标准MPEG-7
多媒体内容描述标准MPEG- 7为了适应人们对多媒体内容检索日益增长的需求以及基于
内容的多媒体检索自身发展的需要
原创力文档


文档评论(0)