- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
毕 业 论 文
图像检索技术研究
摘 要
在网络和多媒体技术越来越发达的今天,信息检索技术成了现在计算机领域的重要内容,而图像检索技术正是这其中的重要内容之一。网络资源的极大丰富以及图像检索技术不断发展成熟,使得图像检索技术的应用领域不断扩大,这为图像检索技术的继续研究提供条件。
以此同时,随着网络传送速度与计算机信息处理速度的提高,网页中对多媒体信息的使用变得十分普及,特别是图像信息,己经成为表示网页内容不可缺少的组成部分。在实现对网页中文本信息提取的同时,如何再为用户抽取所需的图片资料,是信息检索中一个重要的方面。于是各种基于Web的图像检索系统应运而生。它们采用不同的工作方式,极大地方便了用户对网上图像进行检索。: 图像检索 检索引擎 文本处理 信息检索 相似度 相关反馈目 录
1 前言 1
1.1 课题来源 1
1.2现有的图像检索技术 2
1.2.1检索引擎的工作原理 2
1.2.2 图像检索引擎的检索途径 3
1.2.3对几个基本引擎的分析 4
1.2.4 检索引擎的基本要点 5
1.3 图像检索的发展方向 6
2 基于颜色的图像检索 7
2.1颜色特征提取 7
2.2 相似度计算 10
2.3 实验结果 10
3 基于纹理的图像检索 10
3.1纹理特征提取 10
3.2? 相似度计算 13
3.3 实验结果 13
4 综合颜色和纹理特征的图像检索 14
4.1 综合特征检索的思想 14
4.2 相关反馈 15
4.3实验结果及结论 15
5 基于WEB的图像检索 17
5.1 文本与图像之间的关系 17
5.1.1 表示图像内容的文本标记 17
5.1.2文本的权值比较 18
5.2 图像信息检索 18
5.2.1检索模型与相似度 18
5.2.2 分词技术和匹配方法 20
5.3 检索反馈 22
5.4 实验结果 24
6 总结 25
参 考 文 献 27
Abstract 28
致 谢 29
仲恺农业工程学院毕业论文(设计)成绩评定表 30
1 前言
1.1 课题来源
据统,人类接受的外部信息,70%以上来自视觉,图像作为一种内容丰富,表现直观的多媒体信息被大量广泛使用,如何有效管理、检索图像信息成为迫切需要解决的问题。传统的基于文本的检索无法满足海量环境下多媒体信息库的检索要求。为了克服基于文本方法的局限性,出现了基于内容的图像检索。
(1)索引的数据种类丰富,如文字、图像、声音等多媒体。数据的存取协议也是多种多样的,如HTTP、FTP、News、Gopher等;
(2)索引数据量大,以致不可能有某个数据库能包括整个Internet的索引,目前最大的检索引擎,其中的索引也只不过覆盖了Internet的一小部分;
(3)资源消耗太大,系统需要将HTML文件传送至本地然后分析,大量占用昂贵的网络带宽和CPU资源,增加被检索结点的负担。另外由于现有的检索引擎一般是集中式的,所以检索引擎服务器本身的硬件配置也极高,才能处理庞大的数据量和及时地响应用户的查询请求;
(4)不能有效解决索引失效问题,很多时候,检索引擎会返回无效的查询结果;
(5)各检索工具各行其事,不能相互协作,在一定意义上讲是一种资源的浪费。
二十一世纪是一个多元化的信息社会,对图像的需求将是前所未有的巨大的,图像数据库也将得到长足的发展。因此,图像检索系统具有广阔的应用前景。
1.2现有的图像检索技术
近年来随着用户对网上图像检索要求的不断增长,各种图像检索引擎应运而生,它们各自以不同的工作方式为用户提供各种检索途径,使网上图像信息的检索变得非常简单,尽管还不很完善,却已经可以满足用户的大多数要求。
1.2.1检索引擎的工作原理
最基本的检索引擎的结构,是由Spider不停地从Web网上收集数据,存放在检索引擎的数据库中。用户通过检索引擎服务器上的Web接口,提出检索请求,Web Server通过CGI或其它技术访问数据库,并将用户的检索请求转换成相应的数据存取语句,送给数据库引擎处理,并把查询结果通过网页显示给用户。
网络检索的基本原理是通过网络机器人定期在web网页上爬行,然后发现新的网页,把它们取回来放到本地的数据库中,用户的查询请求可以通过查询本地的数据库来得到。
一般来说网络信息检索的实现机制一般有两种:一是通过手工方式对网页进行索引,它的缺点是Web的覆盖率比较低,同时不能保证最新的信息。查询匹配是通过用户写入的关键字和网页的描述和标题来进行匹配,而不是通过全文的匹配进行的;二是对网页进行自动的索引,这种能实现自动的文档分类,实际上采用了信息提取的技术。但是在分类准确性上可能不如手工分类。
在现在所有运行的检索工具来说,一般都有一个Robot定期的访问一些站点,来检查这些站点的变化,同时查
文档评论(0)