依托于内容图片搜索引擎.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1、项目背景及研究目的和意义 项目背景: 图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视知觉的实体,科学研究和统计表明,人类从外界获得的信息约有75%是从图像中获得的[1]。通过绘画或摄影、摄像得到的图像是人类获取信息的重要手段,这些图像以雕刻或纸张印刷的形式保留下来便于人们浏览、查询。但是当计算机以及互联网出现时,图像的浏览、查询发生了根本性的变化。图片搜索也在人们的生活中越来越普及化,因此目前图片搜索引擎很发达,而图片搜索主要分为基于文本的图片搜索引擎、基于内容的图片搜索引擎以及基于语义的图片搜索引擎。其中最为成熟的是基于文本的图片搜索引擎,基于文本的图片搜索引擎的搜索方式是以文本为关键字进行图片搜索。 在基于文本的图片搜索技术研究的早期,图片被作为数据库中存储的一个对象,并人工地用文本对其进行描述。这种方法比较简单易行,一般是使用数据库管理系统(DBMS)来实现,当然,这种方式的缺点也是很明显的:一是需要人工对图片进行注释,工作量相当大,特别是图片数据量非常大时,人工标注是不切实际的;二是人工标注不可避免的会带来主观性和不精确性,因为不同的人对同一幅图片的理解可能是不相同的。所以说在互联网环境下,对网上的海量图片数据进行人工注释是不现实的。 随着信息搜索技术的不断成熟,互联网网页信息自动采集和标引作为搜索引擎的重要组成部分,也得到了深入的研究,首先是广泛应用于文本搜索引擎中,同时也使用来对图片搜索引擎技术进行改进,因为,与文件系统中独立的图片文件不同,互联网上的图片是作为网页的一部分出现的,具有相关的上下文环境,图片所在网页的标题、图片的提示文字、图片的文件名称、与图片密切环绕的文字以及网页中的其它文字,都可以作为对图片进行描述的依据。目前谷歌、雅虎、百度提供的图片搜索服务,都主要是基于这种技术的。 然而,利用网页上的文字来对网页中的图片进行标注,是非常困难、非常不 精确的。例如说这样一个情况:有一个主题为“奥巴马打蓝球遭肘击缝 12 针,太岁头上动土谁如此大胆”的网页,页面中开头位置放置有一张奥巴马刚缝完针的照片,当用户输入“篮球”作为关键词,希望得到一些篮球的特写图片,结果却把奥巴马的这张照片搜索出来了。这就是用网页文字内容对图片进行自动标注造成的不准确的结果。因此基于内容的搜索引擎是目前搜索引擎技术发展的一个重要课题。 基于内容的搜索引擎尝试直接分析图片文件,将它们根据特征分类。用户可以通过提交一幅图片来表达自己的搜索意图(比如用户希望能够搜索到含有类似图片的网站),搜索引擎系统通过对用户提交的图片文件进行分析、比对,输出检索到的信息。目前,基于内容的图片搜索引擎还处在探索阶段,目前还不存在得到广泛运用的通用搜索引擎[2]。有一些研究机构正在尝试从事特定范围的基于内容的图片搜索引擎研究,如针对特定的图片资料库建立搜索引擎,或者对特定类型的图片资料进行检索等[3]。 鉴于基于内容的图片搜索引擎的重要性,国内外已纷纷投入人力财力物力广泛开展研究并研制成一些系统[4,5]。 Virage公司的VIR(Visual Information Retrieval)图像引擎提供了四种可视属性进行图像的检索(颜色、成分、纹理、形状)[13]。每种属性被赋予0到10的权值。该软件对选出的基础图像的色调、色彩以及饱和度进行分析,然后再图像库中查找与这些颜色属相相近的图像。成分特性是指相关颜色区域的近似程度。用户可设定一个或多个属性的权值优化检索。由于要在众多图像特征中配比权值,所以VIR仍然算是一种需要人为参与的图像检索系统。 国内对于图片搜索系统研究相对较晚。国防科技大学的多媒体信息查询和检索系统MIRC,描述了多媒体内容和结构特征以及信息检索数据模型,支持基于内容的多媒体信息查询和检索[6]。根据用户提供的图像或视频帧例子,基于颜色和轮廓特征进行查询。浙江大学的基于内容多媒体检索系统WebscopeCBR,支持基于关键字、全局颜色、局部纹理、对象形状、颜色布局、纹理布局等的查询。但在系统中众多的图像特征依然是独立的状态,未能有效的联合众多图像特征进行检索。 本项目将对现阶段基于内容的图片搜索引擎进行优化、改进,减少人为参与所带来的搜索结果的不准确性。 研究目的和意义: 文本信息无法完全描述图片信息的矛盾已非常显著,人们对于搜索引擎的准确率的要求正随着互联网数据量的增长而提高,因此传统的图片搜索引擎就很难满足需求,相似图片搜索引擎应运而生。 一般的图片搜索引擎通过对图象信息的文字描述来进行检索,而且对于用户来说,不可能在查询时候很精确地用文字对图象进行合理的描述,因此提高查询结果的准确率显得尤为重要。 相似图片搜索是一种新的在线图片搜索引擎:不像其它图片搜索引擎是根

文档评论(0)

xina171127 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档