- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于视觉注意力模型的图像检索的研究1
高静静,张 菁,沈兰荪
北京工业大学 信号与信息处理研究室,北京(100022 )
E-mail:gaojj@
摘 要:随着数字图像和视觉心理学的飞速发展,使用视觉注意力模型进行图像检索成为一
个新的研究方向。本文首先给出了基于视觉注意力模型的图像检索系统的框图,并介绍了几
种面向图像检索的视觉注意力模型原理,然后分析和总结了其性能,最后展望了应用于图像
检索的视觉注意力模型的发展前景。
关键词:图像检索;视觉注意力模型;感兴趣区
中图分类号:TP391
1.引言
随着多媒体技术和因特网技术的飞速发展,数字图像资源急速增多,人们对图像信息的
检索需求也不断扩大[1] 。但是现有检索系统检索结果的相关度较低,用户难以获得满意的结
果[2] 。这是由于检索结果的好坏与用户对图像的理解,即用户对图像感兴趣的内容直接相关。
现有研究表明[3],用户在观察图像的时候,最容易引起用户注意的部分往往是用户感兴趣的
部分;也就是图像中最“与众不同”的部分,即与周围其他部分相比更加显著的部分。视觉
注意力模型就是用来得到图像中最容易引起注意的部分,并用图像表达这种显著性的方法。
因此,利用视觉注意力模型进行图像检索[4-13]可以有效的缩小图像低层特征与高层语义之间
的鸿沟(即语义鸿沟),成为当前人们研究的热点。
本文介绍了应用于图像检索的一些主要的视觉注意力模型,通过对其原理和特点的分
析,为更好的研究视觉注意力模型提供了一些思路。
2.视觉注意力模型与图像检索
利用视觉注意力模型进行图像检索的系统如图 1 所示,首先,通过视觉注意力模型得到
感兴趣区(显著区)或显著点,然后提取相应的特征,并与图像特征库中的图像特征进行比
较,得到检索结果。本节针对一些主要的视觉注意力模型进行详细阐述。
图1 基于视觉注意力模型的图像检索系统
2.1 基于 Itti 模型的图像检索
1本课题得到高等学校博士学科点专项科研基金(20040005015)、国家自然科学基金60402036)
和北京市自然科学基金(4062006)资助。
- 1 -
Itti 模型是由 Itti 等人[4-5]提出的,是最经典的视觉注意力模型之一。该模型的基本思想
(如图2 所示)是,从输入图像中提取多方面的特征,如颜色、方向、亮度等,通过高斯
金字塔和中央周边(center-surround )操作算子形成各个特征的关注图(Conspicuity Maps ),
然后归一化、融合得到显著图(Saliency Map );在此基础上,通过赢者取全神经网络
[14]相互竞争吸引注意焦点,使得最显著区域胜出,即得到感兴
(Winner-Take-All ,WTA )
趣区或注意区;最后通过返回抑制机制抑制当前显著区域,使注意力转向下一个最突出的
区域。
图2 Itti 模型流程
由于 Itti 模型在目标检测效果和运算速度上有突出表现,近年来受到研究者的广泛关
注。目前,国内外许多学者对 Itti 模型进行了研究,提取一定的感兴趣区,可以将其应用到
[5-7]
图像检索中 。
2.1.1 Bottom-Up 模型
Bottom-Up 模型[3,4]是由视觉刺激驱动的信息处理过程,不考虑特定的认知任务对视觉
注意的影响,是基于输入图像的显著性来计算的。
Rutishauser 和 Walther 等人[6]在 Itti 显著图的基础上用 WTA 选取最显著的点,然后找出
对该点的显著性贡献最大的关注图,用区域增长的方式分割该关注图得到相应的感兴趣区。
采用关注图是因为关注图中的特征较少,可以更容易对图像进行分割。该方法提取的最感兴
趣区如图 3 所
您可能关注的文档
- 基于多尺度区域混色RGB欠采样图像颜色错误评价.pdf
- 基于多光谱遥感耕地等别识别评价因素研究_杨建锋.pdf
- 基于多特征融合快速人脸检测.pdf
- 基于分光光谱仪测量不同产区烤烟表面颜色分析.pdf
- 基于分类视角我国环保投资综合效益研究_祝婧然.pdf
- 基于风电闪变问题闪变仪研究_刘桂龙.pdf
- 基于肤色和运动检测技术单目视觉手势分割.pdf
- 基于改进彩色图像形态学膨胀和腐蚀算子设计.pdf
- 基于高斯混合模型区域颜色迁移.pdf
- 基于高速数据采集离合器踏板特性测试系统.pdf
- 选择性必修三 8.2 分析与综合及其辩证关系 课件.ppt
- 《千米级跨度公铁两用悬索桥运维管理规程》.pdf
- 《家用和类似用途自动升降激光雷达清洁机器人》.pdf
- 《渐变焦眼镜用眼镜架》.pdf
- 基金研究-行业主题基金专题研究(二):医药主题基金研究框架及产品优选.pdf
- 永威置业车库金刚砂地坪施工标准图册.docx
- 国企深基坑全流程施工技术手册.docx
- 中国与全球人工智能竞赛 China and the Global AI Race -中国与全球人工智能竞赛长江商学院白皮书.pdf
- 2025年NVIDIA AI研发技术开放日主题演讲-加速计算专场.pdf
- kpmg -2025代理型AI优势:开启人工智能价值新层级研究报告 The Agentic AI Advantage Unlocking the next level of AI value.pdf
文档评论(0)