- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
-大学生毕业论文改web中图像的检索技术研究
WEB中图像的检索技术研究
第一章 前言
1.1引言
伴随网络技术的迅猛的的信息了的出现距离研究还要下大力气研究。如下
(1)搜索的数据种类多样,如视频、图片、文字等。存取协议也是种类繁多,如HTTP、FTP、News等等;
(2)索引数据量巨大,从而导致不可能有某一个数据库可以包括整个网络的索引,当下最大的搜索引擎,其索引也仅仅覆盖了网络的一小部分而已;
(3)资源消耗过大,系统需将HTML文档传送到本地之后再要求
(4)不能有效解决搜索失效的问题,大多时候,搜索引擎会返回无用的查询结果;
(5)各种检索工具各行其事,无法相互协作,共享资源,也是一种资源的浪费。
近些年伴随着用户对图像搜索需求不断的增长,各类图像搜索引擎由此诞生
1.2.1搜索引擎的工作原理
最初的搜索引擎结构,是让Spider不停的从Web收集数据,存储在搜索引擎数据库当中。用户靠搜索引擎服务器的Web接口,发出搜索请求,让Web Server通过CGI或者其它技术访问数据库,并且将用户搜索请求变成相对应的数据存取语句,发送给引擎处理,然后把结果通过网页显示反馈给用户。
网络检索的基本原理其实就是通过Spider定期在web上运行,发现新的数据,把其取回到本地数据库中,让用户查询的请求可通过查询本地的数据库得到。
常用的网络信息检索实现机制可分为一种方法第二种方法方法是的类对web)不同大小排序一来相对会
当前,图搜索引擎通过以下两方法识别图像:
(1)自动查找图像。通过IMGSRC和HREFHTML标签)来检是否可显示的图文件,IMGSRC的是“显示下面的图像文件”,导向嵌入式图;HREF则用来表示“下面是一个链接”,导向被链接的图。引擎通过检查扩展名来判断导向是否图文件,文件扩展名是.png.jpg、.gif等,说明是一个可显示的图。
(2)人工干预找出图。进行,人工对网上的图像及站点进行。这方法可产生的查询体系,劳动强度大,因此图像的数量有限。
由于图像文本,要人们按照的理解来说明其蕴含的意义,文字更趋于因此计算机,图像检索难度比文本的查询难度要高出很多。
1.22 图像搜索引擎检索途径
1.关键词检索
传统图像检索技术靠关键字精确匹配检索,即输入关键字,输出图。它包括两种途径:
(1)基于图外部信息进行。即图的文件名目录名、路径名、以及图像周围文本信息等外部信息进行检索,这是图搜索引擎最多的方法。找图像文件后,搜索引擎通过查看文件名或路径名确定文件内容,也可以通过查看图标题来匹配检索词。
(2)基于手工标注的检索。手工对图像的内容(如对比、、等)进行描述分类,将标注为一系列关键字,并建立索引。检索时,将主要在这些词中搜索用户输入的关键字。这种查询方是比较准确的,可以获得好的查准率,但需人工参,劳动强度,限制了可处理图像数量。,由于图所包含的信息量庞大,不同用户对同一张图的看法又不尽相同,一万个读者有一万个哈姆雷特一般,从而导致了对图像标注缺乏统一标准。
2.基于图像内容的主要是由图分析软件自动图的颜色、等特征,建立特征库,其输入弱国为用户要查找图的大致特征或示例,通过一定相似匹配规则,输出为与图片具有相近特征的图,按相似程度排列,供用户选择,从而在传统图像检索技术中一般用户难以完成的图像特征描述、提取与识别等难题这是基于图本身特征的检索,适用于检索目标的查询要求,目前这种较成熟的检索技术主要应用于图数据库检索。在图搜索引擎中应用这检索技术还有困难,但有部分图像搜索引擎尝试这种检索方法。1.2.3对几个基本引擎的简单分析
(1)InfoSeek是一个简单而又功能强大的索引,它的优点是有面向主题搜索而且可扩展的分类。可以把搜索关键字和相似的分类目录主题短语互相作为
(2)AltaVista 是个大容量的,基于机器人
(3)Scour自称是第一个基于web的多媒体搜索引擎。严格讲,它并非是个图像搜索引擎,但是可以将检索局限在图像搜索上。
Scour工作原理是在文件名、路径名、ALT标签中搜索关键词。主要使用关键词搜索,可以用符号+或-来增加、排除关键词,使用较少关键词会更有效。在高级模式中,可以将检索结果图像锁定在GIF、PNG、JPEG等格式中。检索结果显示简图、图像类型(如GIF、JPG)、大小、最后查找日期、检索词匹配数量、标引使用关键词、成功下载可靠程度等,并且同时给出图像文件的URL和源站点URL。
主要缺点是标引的深度太浅,查准率比较低,但查全率比较好。
(4) Amazing Picture Machine是由NCRTEC开发的一个真——人工建立完全关键词式索引。最大特点就是人工干预,关键词检索是其主要的检索手段。
Amazing Picture Machine搜索的结果显示一个简短标题、有关图像说明、文件大小、文件类型以及象素多少
您可能关注的文档
- _90后_员工工作满意度研究基于杭州的实证---本科毕业论文.doc
- _居室眼睛_智能安防窗户控制系统--本科毕业论文.doc
- [-大学毕业论文]电冰箱保护电路设计论文.doc
- 《--铜垫片倒装复合模说明书--》 冲压模具-本科毕业设计论文.doc
- 1_2000大比例尺数字测图-测量-本科毕业设计.doc
- 10万吨生物控释肥料可行性论证研究报告.doc
- 5.9万吨每年浮阀式连续精馏塔的设计-本科毕业论文.doc
- 14建工-概论-习题讲义.doc
- 30mw生物质热电项目工程epc项目可行性论证研究报告.doc
- 16×16位移位相加乘法器设计论文-大学毕业论文.doc
- 养老评估师中级行为面试题库及案例分析.docx
- 面试培训督导时考察其课程理解能力的题目.docx
- 税务专员面试中关于增值税政策的常见问题解答.docx
- 2025宁波市医疗保障局局属事业单位宁波市医疗保障基金管理中心招聘事业编制工作人员1人备考试题附答案.docx
- 2025咸宁市汉口银行咸宁嘉鱼支行招聘笔试历年题库附答案解析.docx
- 2025北京人才发展战略研究院招录笔试备考题库附答案.docx
- 2025四川成都市龙泉驿区青台山中学校秋季教师招聘22人笔试试题附答案解析.docx
- 2025台州市银龄讲学计划教师招募13人笔试参考试题附答案解析.docx
- 2025中国铁建公开招聘42人笔试题库附答案.docx
- 2025中智咨询研究院社会招聘笔试参考题库附答案.docx
最近下载
- 四川党政领导干部政治理论水平考试(任职资格考试)综合能力测试题及答案.docx VIP
- 钻孔灌注桩监理实施细则.docx
- 校企合作开发高职教材的探索与实践.pdf VIP
- 第十一章 化妆品的选择和使用.pptx VIP
- 四川2025年党政领导职务政治理论水平任职考试精选练习试题及答案.docx VIP
- 【公开课】直线、射线、线段+说课课件2024-2025学年人教版数学七年级上册.pptx VIP
- 回顾现代汉语词汇的发展历程及研究成果.docx VIP
- 《定风波》ppt课件完整版.pptx VIP
- 母亲住宅复杂性与矛盾性的研究.pdf VIP
- “专精特新”中小企业高质量发展的促进路径研究.docx VIP
原创力文档


文档评论(0)