图像检索方法介绍.docVIP

下载本文档

5
0
约3.57千字
约 8页
2018-05-15 发布于福建
举报
版权申诉

图像检索方法介绍.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

图像检索方法介绍

图像检索方法介绍　　[摘要]本论文针对Intemet日益增长的多媒体信息检索应用需求，介绍了目前国内外现有的图像检索的系统及方法。　　[关键词]多媒体信息检索；图像检索；TBIR；CBIR 　　[中图分类号]TP393　[文献标识码]A 　　[文章编号]1007-4309(2011)01-0074-1.5 　　　　随着通信和计算机的发展，存储技术的提高和Interact的日渐普及，我们拥有了海量的信息资源。这其中，不仅仅有简单的文本数据，更加包括了大量的图像、视频等多媒体信息。很明显，只有合理地组织这些资源，并研究高效的查询方法和检索方法，才有可能充分利用它们。于是各种针对Interact的图像搜索引擎应运而生，极大地方便了用户对Interact图像进行检索。　　Web图像检索系统按照其组织和管理图像方式的不同，主要可以分为以下几类。基于文本的图像检索(Text-Based ImageRetrieval，简称TBIR)和基于内容的图像检索(content-BasedImage Retrieval，简称CBIR)以及综合文本信息和图像视觉信息的web图像检索。　　　　一、基于文本的图像检索　　　　传统的信息检索是基于关键字的信息检索，即输入关键字，检索出与之相匹配的文本对象。哪怕检索对象本身不是文本，而是例如声音、图形、图像、视频等其他类媒体，也是用关键字对这类媒体对象进行标识或索引，建立起与这类媒体对象之间的逻辑联系。　　TBIR的历史可以追溯到20世纪70年代，由于数据库技术的进步而建立和发展了基于文本的图像检索技术，并取得了一定成果，例如数据建模、多维数据索引、查询优化和查询评估等。图像数据研究者们在对图像进行文本标注的基础上，对图像进行基于关键字的检索。其基本步骤是先对图像文件建立相应的关键字或描述字段，并将图像的存储路径与该关键字对应起来，然后用基于文本的数据库管理系统来进行图像检索。该方法实质是把图像检索转换为对与该图像对应的文本检索。　　早期的图像检索系统采用文本数据形式对图像进行人工注释，建立图像索引数据库。这种人工标注的方法适合有限范围的图像库管理系统，如人事档案照片库、动物图谱库、商标图案库等。但在Web环境中，Web图像数据是海量的，无法采用人工方式对图像进行广泛的关键信息标注，只得借助Web中相关的文本信息，采用适当的算法提取图像的主题，实现图像自动标注。显然，对图像自动标注的准确性依赖于Web中图像关键信息的提取算法。目前这些关键信息的提取主要从以下几个图像的外部信息中提取：图像的文件名及网址、图像的替代文字、图像周围的文字、图像所在页面的标题、图像的超链接、图像所在网页彼此间的链接。　　目前多数图像搜索引擎(网站)，如Google、Yahoo、Al-taVista、Infoseek、LyCOS、Scour、WebSeek、搜狐等，普遍采用此种方式。有的研究者把网页按照其组织内容的框架和结构将网页分割成多个基本块，然后将块内的元素作为一个基本的语义单元实现Web检索。有些研究者使用网页内的链接信息实现Web检索。还有些人使用缩略图帮助web用户在基于文本检索的结果中更好地定位感兴趣的图像；部分研究者使用网页的文本片段(Text Snippet)和图像片段(Image Snippet)帮助用户快速定位其感兴趣的网页。　　互联网上的网页搜索是由网络爬虫完成的，但是随着Web的发展，其结构越来越复杂，其中的网页数量越来越多，通用爬虫越发不可能访问Web L的所有网页并及时进行更新，简短的关键词输入无法表达出用户的复杂查询语义。　　“主题爬虫”这一概念是由S，Chakrabarti在1999年WorldWide Web大会上首次提出的。与一般的网络爬虫不同，主题网络爬虫不是对所有链接不加选择地爬行，而是面向主题地、有选择地爬行。主题爬虫分析每个网页的链接，预测哪些链接指向的网页可能和预定主题相关，对这些链接进行优先爬行，而舍弃那些和主题无关的链接。　　目前，主题网络爬虫技术研究正在成为一个热点。在1999年出现了IBM Focused Crawler。如今，主题爬虫又有了新的发展，国外典型的系统有Context Graphs Focused Crawler、WTMS系统等。　　　　二、基于内容的图像检索　　　　20世纪90年代初，人工智能、数字信号处理、统计学、自然语言理解、数据库技术、心理学、计算机视觉、模式识别和信息处理等技术都得到了不同程度的发展。在此基础上，为了克服基于文本信息检索带来的困难，提出基于内容的图像检索(content-Based Image Retrieval，简称CBIR)技术，从可视化角度对图像检索进行探讨