- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图像检索系统外文翻译
基于内容的图像检索系统的设计与实现
外文翻译
学生姓名 陈佳
学 号
指导教师 汤宇 职称 讲师
专 业 信息工程
东华理工大学软件学院
二零一零年六月
2009年第二届基于相似性搜索和应用的研讨会
在Flickr网站上的基于文本和基于内容的图像检索: 演示
胡安·曼努埃尔·巴里奥斯,本杰明·布斯托斯
计算机科学系
智利大学,圣地亚哥
邮箱: jbarrios,ddiaz,bebustos@dcc.uchile.cl
摘要
我们提出基于文本和内容相结合的图像检索系统。我们的想法是在原来标准的内容检索基础上,利用文本表示图像标题,描述图像并且标识每个图像来提高检索结果。这个系统包含两种不同的用户界面:终端用户必须在Flickr网站的浏览器侧边栏输入要搜索图片的URL地址,然后,系统从收集到的图像集合里面搜索相似的图像。另一种用户界面是为有经验的高级用户设计的,可以为不同搜索特征定义距离函数和权值,以得到更好的搜索效果。
关键词:图像库,信息检索
1. 简介
基于文本的图像检索,提供语义相似度较近的搜索结果,然而,基于内容的图像搜索提供视觉相似度较近的搜索结果。由于两种方法的独立性,很可能它们的结合能够提高搜索系统的性能,依靠两种方法的益处。在目前的工作,我们提出了一个文本和内容相结合的图像检索系统。
2. 系统概述
目前图像搜索系统已经实现用Java 1.6,C++和PostgreSQL完成。这个图像对象的集合使用SAPIR[3]从Flickr网站分离出来。在离线阶段,使用SAPIR集合提供的URL地址把图片从Flickr网站下载下来。从图像中提取的基于内容的描述有:使用3×3×3RGB色彩空间的颜色直方图(27D矢量),Gabor小波(48D矢量),使用RGB色彩空间的8*1高效颜色描述(ECD)(32D矢量),使用HSV色彩空间的8*1高效颜色描述(ECD)(32D矢量),和边缘局部4*4(80D矢量)。颜色直方图和Gabor小波描述基于C++的OpenCV库完成,并且其它的基于Java完成。基于文本的描述(标题,描述,标签)提取于SAPIR集合。特征向量计算通过向量模型和tf-idf加权算法[1]。为每幅图像建立六种特征向量,三个使用词干提取算法,三个不使用。一个词表,非索引字表,文本特征的反向文件(有词干或者没词干)都会被计算和存入PostgreSQL
数据库。在联网阶段,用户为每个可获得的特征输入示例图片,一个搜索文本和一个权重距离函数。这个距离函数能够被测量(像欧几里得距离)或者不能度量(像DPF和余弦距离)。然后,系统用距离函数的加权组合和相对于原始图像的最大距离做的归一化操作之后执行一个k-NN搜索。为了有效地检索一个小的图像子集所有基于文本和基于内容的特征(最高达11个特征/每个图像)存储在PostgreSQL数据库,并且每幅图像有一个相应地二进制文件做线性扫描。当前,这个系统包含超过115,000图像在这个集合并且二进制文件的大小大约达到了130MB。这个系统包含了两种不同的图形用户界面:一种浏览器侧边栏(为终端用户设计),一种高级查询(为有经验的用户设计)。
3.浏览器侧边栏
这个界面为终端用户设计,它在浏览器上包含一个侧边栏(如图片1所示)。当用户在Flickr站点正在浏览图片并且想执行一个搜索,他必须复制正在查看的图像的URL并且粘贴到浏览器侧边栏的URL文本输入区域。最终返回给用户的结果按相似性大小排序返回给用户,这个相似性的计算是通过度量图像库中每个特征元素相对于示例图像特征元素的距离实现的。之后,用户能够单击获得的图像,并将它显示在Flickr站点上。
4. 高级搜索
在一个高级搜索(如图像2所示),这个用户能够通过多种途径输入示例图像:上传一个图像文件,输入一个公共图像的URL,或者输入一个在Flickr站点显示的图像的URL(这是唯一的方式,示例图像将包含基于文本和基于内容特征),或者选择之前的示例图像(有效的对于重复使用的示例图像)。然后,用户能够输入一个查询文本。这个查询文本限制了相似度查询对象的范围。如果用户不输入查询文本,那么任何和示例图像有一定相似度的图像都能被查询到。如果示例图像不包含基于文本的特征,这个查询过程将搜索整个图像集合。只有输入示例图像和文本,用户才能选择用于比较的特征,通过对每个特征的每个距离函数加权。然后,系统标准化处理距离的集合。最后,搜索结果会显示给用户,并且同时显示为每个搜索到的图像的计算距离将被显示。这个系统显示一个相似图像链接为每个结果,允许用这个搜索到的结果图像作为示例图像去开始一个新的搜索,同时这个结果图像的链接将发布到
您可能关注的文档
- 国内旅游单项委托服务合同.doc
- 国内氟硅橡胶的发展概况.doc
- 国内外历史文化名镇保护研究.ppt.ppt
- 国内大客户营销培训第一人.ppt
- 国内湿地公园介绍.doc
- 国内外高新区案例选介集成国内外知名科技园.doc
- 国内私人银行竞争格局分析及业务发展策略探讨.doc
- 国内环保节能家电展览会策划方案.doc
- 国内贸易融资.ppt
- 国内酒店贴身管家服务论文.doc
- 电力工程试验施工方案(3篇).docx
- 初中英语项目式学习中的文化背景知识导入策略教学研究课题报告.docx
- 高中体育课程中民族传统体育项目推广与普及研究教学研究课题报告.docx
- 2025年广东省广晟资产经营有限公司校园招聘模拟试题附答案.docx
- 自由落体运动课件-高一上学期物理人教版.pptx
- 独厨独卫改造工程方案(3篇).docx
- 2025 年山西省中等职业学校第二次对口升学模拟联考中职英语试卷.pdf
- 废水治理工程技术方案(3篇).docx
- 2025 年山西省中等职业学校第二次对口升学模拟联考中职英语试卷.docx
- 高中历史大概念教学对学生历史思维能力的促进作用教学研究课题报告.docx
文档评论(0)