- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现状概述及研究方案的确定
一、图像检索的目的和意义
随着计算机应用的普及信息处理技术的发展,以文本、图像、声音和视频为主的媒体信息迅速成为信息交流和服务的主流,现代信息处理的对象和方法都有了很大的变化。大量各种信息被生成、采集、传输、流通和应用,我们正在快速进入一个信息化的社会。值得关注的是全世界的数字图像的容量正以惊人的速度增长,每天都会产生数以百万记的图像。随着互联网的发展,越来越多的人能够更加方便、快捷、经济地接触到这些图像媒体,人们面临的问题不再是缺少图像媒体的内容,而是如何在浩如烟海的图像世界中找到自己所需要的信息。如果没有对图像及视频数据的自动和有效地描述,大量信息将淹没在信息的海洋之中,无法在需要时被检索出来。这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术。
二、图像检索的主要研究内容和技术现状
图像检索的过程就是图像特征的提取、分析及匹配。
特征提取:提取各种特征,如颜色,纹理,形状等。根据提取的特征不同,采取不同的处理,比如提取形状特征,就需要先进行图像分割和边缘提取等步骤。选择合适的算法,并在效率和精确性方面加以改进,以适应检索的需要,实现特征提取模块。
特征分析:对图像的各种特征进行分析,选择提取效率高、信息浓缩性好的特征,或者将几种特征进行组合,用到检索领域。
特征匹配:选择何种模型来衡量图像特征间的相似度。
检索进行查询的层次基本可分为三层:
(1)基于原始数据的查询。这是最低层次的查找,每一幅图像为象素点的简单有序的集合体,查询时相似性的度量标准是点对点的比较。这个层次的比较是非常具体的,只有在使用相对精确匹配时才有用。
(2)基于特征的查询。这是较高层次的查询,在基于特征的层次上描述图像。图像特征包括原始属性:颜色、纹理、形状等,也包括脱离了原始性的抽象属性:灰度直方图,颜色直方图,空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征,同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存。查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。
(3)基于语义的查询。这是最高层次的查询。可以看作是基于对象的查询。查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。
目前实现图像检索的手段有很多,包括基于分数维的图像检索、基于多颜色空间的图像检索方法、基于内容的图像检索、基于区域的图像匹配算法的关键技术研究、基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟,检索的效果也越来越好,但仍未上升到图像语义的图像检索阶段。
三、研究方案
图像检索需要匹配图像间相似度,因此需要设计度量图像间距离的模型。不同的特征可以被分成不同的特征矢量组。图像的特征划分基本上是根据特征矢量的不同特征。同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存。查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。于是检索的设计转移到了图像特征空间的设计上。图像的特征大体分三类:颜色、形状、纹理。其中图像数据中直接包含的信息就是颜色,具有相同颜色的像点在一起聚合成各种形状,在人的大脑中抽象成各种符号,如果计算机也会这种抽象的过程,那么所有的问题就解决了。因此设计图像特征空间就要包含这种抽象的过程,使计算机处理图像后的结果尽量接近人脑思考后的结果。这既有可能会导致图像搜索上升一个层次——语义层搜索。可以看出图像的语义抽象距离现在已经不再遥远了。
作为图像的基本特征:颜色,人们针对它已经设计了很多种算法,包括颜色直方图、加权颜色直方图、颜色聚合度、模板匹配、模糊颜色连通直方图、颜色恒常性颜色检索等等,所有这些包括其中一些非常经典的算法的都没有很好的解决图像特征提取与匹配。因为他们往往都是依靠统计学对图像处理,而统计学一般都会舍弃统计中出现较小概率的事件从而达到较高效率的匹配,因此这样做在匹配结果上无论如何都不会使人满意。而且统计学往往只统计颜色信息往往就忽略了空间分布导致了损失了大量有用的图像信息。
所以要设计一种N维模板,其中既包含颜色信息又包含空间分布信息。在拥有这种模板后还要设计计算N维矢量间距离的算法。
但是RGB颜色空间并非均匀的线性空间,实验结果证明,距离一定的两种颜色,随这两种颜色的不同引起人的色知觉的差异是不同的。也就是说,对一定距离的某两种颜色让人感到色知觉差异很大,但对另外两种一样距离的颜色,可能会让人感觉差异很小。而在对颜色进行聚类量化时,需要用数量来描述颜色间的差别,简称它为
原创力文档


文档评论(0)