基于多媒体融合的图像检索的技术.docVIP

下载本文档

3
0
约 4页
2017-08-17 发布于重庆
举报
版权申诉

基于多媒体融合的图像检索的技术.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于多媒体融合的图像检索的技术.doc

基于多媒体融合的图像检索的技术陆伟艳（广西民族师范学院广西崇左 532200 ）摘要：基于多媒体融合的图像检索技术是目前研究的热点。本文分析了并总结基于多媒体融合的图像检索的概念，综述基于多媒体融合的图像检索的方法和相关的技术。最后简单介绍一种新的基于语音识别的图像检索的方法以及实践。关键词：多媒体融合；图像检索作者简介：陆伟艳（1980—），壮族，女，桂林电子科技大学硕士，讲师，研究方向：信息与信号处理与移动通信系统网络，工作单位：广西民族师范学院。 1、引言随着多媒体技术和网组的迅速发展，以及3G、4G移动通信系统的发展，移动通信从语音业务过渡到移动宽带业务的发展出现了移动多媒体广播业务。多媒体信息的数据从以前的紧缺飞速的增，并随着人们日益需求的不断增加而迅速增加。图像信息的应用日益广泛，人们对图像数据的查询需要日益增长，对规模越来越大的图像数据库进行有效的管理就成为迫切需要解决的问题了。基于多媒体融合的图像检索的概念 2.1基于多媒体融合的图像检索多媒体信息是指以文字、图像、影像、声音和动画等为表现形式的媒体信息。所谓的基于多媒体融合的图像检索是对图像对象的内容及上下文语义环境精心检索，如图像的颜色、纹理、形状、符号，描述图像的语音等语义特征来实现与图像内容信息相关的检索。 2.2基于内容的图像检索技术的概念基于内容的图像检索是依靠图像特征进行标引和检索。所谓图像特征的画面内容特征（图像颜色和纹理等），以及图像的主题对象特征。基于内容的图像检索主要技术着重于图像的画面内容特征和主题对象特征来进行检索。它直接对图像内容进行分析，抽取特征和语义，利用这些内容特征建立索引进行检索，还融合了模式识别、计算机视觉及图像理解等技术。图1 基于内容的图像检索技术的概念模型 2.2.1基于颜色特征的检索颜色特征是图像检索中所使用的最直观的视觉特征。在基于颜色检索中除了采用颜色直方图外，还引用了空域信息，它确保检索的精度。在引用空域信息的时候要兼顾不变性的问题。同样，为了更好的保存图像色彩空间的信息，PASS提出了图像的色彩聚合向量（CCV）来做图像的索引。 2.2.2基于形状特征的检索形状特征也称为轮廓特征，是指整个图像或图像中子对象的边缘特征。采用形状特征进行检索时，用户可以通过勾勒图像的形状或轮廓，从图像库中检索出形状相似的图像。基于形状的检索更多的用于当用户粗略的画出一个轮廓进行检索的情况。用户可以选择某一形状或勾画一副草图，利用形状特征或匹配主要边界进行检索。基于形状特征的检索方法主要有两种：针对轮廓线进行的形状特征检索，也就是分割图像进行边缘提取后，得到目标的轮廓线。直接针对图形寻找适当的向量特征进行检索。 2.2.3．基于纹理特征的检索纹理检索与纹理分类技术有着密不可分的关系，包括有两种方法：一种是统计方法，人们提出以图像像素的颜色的分布统计信息和轮廓点的位置分布统计信息作为图像的特征量，并使用该特征量实现图像的检索。另一种是结构方法，通过对纹理颜色的定性描述，把检索空间缩小到某个颜色范围，然后再以示例查询的方法为基础，调整粗糙度、方向性和对比度三个特征值，逐步逼近要检索的目标。 2.2.4.基于对象特征的检索基于对象特征的检索就是对图像中所包含的静态子对象进行查询，检索条件可以利用综合颜色、纹理、形状特征、逻辑特征及客观属性等，例如综合利用颜色和纹理特征。基于对象特征的检索首先要对图像进行预处理，将原始像素信息分割成一些颜色和纹理在空间上连贯分布的区域，计算出每个区域的颜色、纹理和空间特征。这种方法用于检索图像对象或子对象，所以出来对图像要做预处理外，还需要进行图像分割，在难度和复杂度上，比基于颜色和纹理的检索技术更进一步。对于分割后的每个区域，用一个多维向量来表示其颜色、纹理、形状及空间关系等特征，这样对于一个给定的区域，所得到的多维向量是确定的。检索的时候，根据用户所提供的信息或草图，利用高效的检索算法进行匹配，再根据相似性测度函数进行过滤，将相似度高的图像提供给用户。 3、基于语音识别的图像检索方法与实践基于多媒体融合的图像检索技术主要分为两大模块：语音识别模块和图像检索模块。在文献中采用的是手动图像标注的方式进行语音识别对数字图像进行检索，这种方法有一定的创造性，但是运用起来工作量繁重尤其是对海量的图像数据。针对此问题本文介绍一种图像语义自动标注的图像检索系统，如图2所示为本文将介绍的基于多媒体融合的图像检索系统流程图。图2 系统流程图基于语音识别的图像检索系统的用户查询与基于文本的图像检索、基于内容的图像检索系统不同的是用户是说出查询关键词，算法通过分析将查询要求转化为计算机内部描述，从而获得查询图的特征，然后借助特征库中的特征匹配从图像数据库提取出用户需要图像