改web中图像的检索技术研究毕业设计.doc

下载文档 降价啦

1
0
约9.04千字
约 14页
2017-02-02 发布于辽宁
举报
版权申诉
保障服务

改web中图像的检索技术研究毕业设计.doc

1、本文档共14页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

改web中图像的检索技术研究毕业设计

WEB中图像的检索技术研究第一章前言 1.1引言伴随网络技术的迅猛的的信息了的出现距离研究还要下大力气研究。如下 (1)搜索的数据种类多样，如视频、图片、文字等。存取协议也是种类繁多，如HTTP、FTP、News等等； (2)索引数据量巨大，从而导致不可能有某一个数据库可以包括整个网络的索引，当下最大的搜索引擎，其索引也仅仅覆盖了网络的一小部分而已； (3)资源消耗过大，系统需将HTML文档传送到本地之后再要求 (4)不能有效解决搜索失效的问题，大多时候，搜索引擎会返回无用的查询结果； (5)各种检索工具各行其事，无法相互协作，共享资源，也是一种资源的浪费。近些年伴随着用户对图像搜索需求不断的增长，各类图像搜索引擎由此诞生 1.2.1搜索引擎的工作原理最初的搜索引擎结构，是让Spider不停的从Web收集数据，存储在搜索引擎数据库当中。用户靠搜索引擎服务器的Web接口，发出搜索请求，让Web Server通过CGI或者其它技术访问数据库，并且将用户搜索请求变成相对应的数据存取语句，发送给引擎处理，然后把结果通过网页显示反馈给用户。网络检索的基本原理其实就是通过Spider定期在web上运行，发现新的数据，把其取回到本地数据库中，让用户查询的请求可通过查询本地的数据库得到。常用的网络信息检索实现机制可分为一种方法第二种方法方法是的类对web）不同大小排序一来相对会当前，图搜索引擎通过以下两方法识别图像： (1)自动查找图像。通过IMGSRC和HREFHTML标签）来检是否可显示的图文件，IMGSRC的是“显示下面的图像文件”，导向嵌入式图；HREF则用来表示“下面是一个链接”，导向被链接的图。引擎通过检查扩展名来判断导向是否图文件，文件扩展名是.png.jpg、.gif等，说明是一个可显示的图。 (2)人工干预找出图。进行，人工对网上的图像及站点进行。这方法可产生的查询体系，劳动强度大，因此图像的数量有限。由于图像文本，要人们按照的理解来说明其蕴含的意义，文字更趋于因此计算机，图像检索难度比文本的查询难度要高出很多。 1.22 图像搜索引擎检索途径 1.关键词检索传统图像检索技术靠关键字精确匹配检索，即输入关键字，输出图。它包括两种途径： (1)基于图外部信息进行。即图的文件名目录名、路径名、以及图像周围文本信息等外部信息进行检索，这是图搜索引擎最多的方法。找图像文件后，搜索引擎通过查看文件名或路径名确定文件内容，也可以通过查看图标题来匹配检索词。 (2)基于手工标注的检索。手工对图像的内容（如对比、、等）进行描述分类，将标注为一系列关键字，并建立索引。检索时，将主要在这些词中搜索用户输入的关键字。这种查询方是比较准确的，可以获得好的查准率，但需人工参，劳动强度，限制了可处理图像数量。，由于图所包含的信息量庞大，不同用户对同一张图的看法又不尽相同，一万个读者有一万个哈姆雷特一般，从而导致了对图像标注缺乏统一标准。 2.基于图像内容的主要是由图分析软件自动图的颜色、等特征，建立特征库，其输入弱国为用户要查找图的大致特征或示例，通过一定相似匹配规则，输出为与图片具有相近特征的图，按相似程度排列，供用户选择，从而在传统图像检索技术中一般用户难以完成的图像特征描述、提取与识别等难题这是基于图本身特征的检索，适用于检索目标的查询要求，目前这种较成熟的检索技术主要应用于图数据库检索。在图搜索引擎中应用这检索技术还有困难，但有部分图像搜索引擎尝试这种检索方法。1.2.3对几个基本引擎的简单分析 (1)InfoSeek是一个简单而又功能强大的索引，它的优点是有面向主题搜索而且可扩展的分类。可以把搜索关键字和相似的分类目录主题短语互相作为 (2)AltaVista 是个大容量的，基于机器人 (3)Scour自称是第一个基于web的多媒体搜索引擎。严格讲，它并非是个图像搜索引擎，但是可以将检索局限在图像搜索上。 Scour工作原理是在文件名、路径名、ALT标签中搜索关键词。主要使用关键词搜索，可以用符号＋或－来增加、排除关键词，使用较少关键词会更有效。在高级模式中，可以将检索结果图像锁定在GIF、PNG、JPEG等格式中。检索结果显示简图、图像类型（如GIF、JPG）、大小、最后查找日期、检索词匹配数量、标引使用关键词、成功下载可靠程度等，并且同时给出图像文件的URL和源站点URL。主要缺点是标引的深度太浅，查准率比较低，但查全率比较好。 (4) Amazing Picture Machine是由NCRTEC开发的一个真——人工建立完全关键词式索引。最大特点就是人工干预，关键词检索是其主要的检索手段。 Amazing Picture Machine搜索的结果显示一个简短标题、有关图像说明、文件大小、文件类型以及