《注意力模型的当前发展水平.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《注意力模型的当前发展水平

题目:注意力模型的当前发展水平 作者:Ali Borji, and Laurent Itti 摘要:视觉注意力的建模,特别是刺激驱动的,基于显著性的注意力,在过去25年内已经是一个非常活跃的研究领域。现在有很多不同的模型,除了给其他领域带来理论贡献以外,这些模型已经在计算机视觉,移动机器人,和认知系统展示出成功的应用。这里我们从计算角度综述应用在这些模型的基本概念。我们提出了对大概65个模型的分类,提供了一个方法、性能和缺点的关键的比较。特别是,提出了从行为研究和计算研究得出的13个标准,来量化笔记注意力模型。并且,我们解决了一些具有挑战的模型问题,包括计算模型的生理解释,与眼动数据库的关系,自上而下和自下而上的分离,以及构建有意义的性能指标。最后,我们突出注意力模型的今后研究方向,为未来提出见解。 1,介绍   每秒钟有大量的视觉信息进入人们的眼睛[1][2]。如果没有一个智慧的机制来滤除视觉数的中的错误的数据,实时处理这些数据将是一个非常恐怖的事情。高层次的认知和复杂处理,比如物体认知或者场景理解,都依赖这些经过这种方式【注:一个智慧的机制来滤除视觉数的中的错误的数据】转换过的易处理的数据。本文将讨论的这个机制就是视觉注意力,他的核心在于选择机制的思想以及相关的概念。对人类来说,注意力通过已经进化为高分辨率的中央凹的视网膜【注:中央凹(central fovea):是眼球后极视网膜上一个浅黄色的区域,称为黄斑。其中央有一椭圆形小凹,称为中央凹】和一个底分辨率的周围区域实现的。尽管视觉注意力将这些解剖学组织指向场景中的重要部分来采集更具体的信息,(视觉注意力模型的)主要问题是基于这个指向的计算机制。   近年来,科学研究的很多方面已经旨在回答这个问题。心理学家研究了视觉注意力的相关行为,比如变化盲点[3][4]【注:变化盲点Change blindness是一个心理学现象,当刺激发生变化时,人们往往无法注意到】,无注意力盲点[5]【注: 无注意力盲点inattentional blindness是我们无法注意到一些显而易见的激励】和注意瞬脱[6]【注:注意瞬脱attenional blink是指在一个连续的注视过程中,我们会短时间内无法注意到一些显著的物体或者其他东西】。神经生理学家证明了神经元是如何适应自己来更好的感知感兴趣的物体[27][28]。计算神经科学家已经构建了现实的神经网络模型来模拟和解释注意力行为(比如[29][30])。受这些研究的鼓励,机器人学家和计算机视觉科学家已经试图解决计算复杂度的内在问题来构建能够实时工作的系统(比如[14][15])。尽管现在在以上提及的研究领域已经有很多模型,这里我们仅讨论能够计算图像或者视频的显著图的模型(见下节的定义)。对于计算视觉注意力的计算模型的一般综合,包括偏向竞争[10],选择调节[15],注意力模型的规范化[181],和其他模型,参考[8]。从心理学、神经生理学以及计算角度出发的注意力模型的综述,参考[9][77][10][12][202][204][224]。图1显示了注意力研究的分类,并突出了我们的综述范围。 1.1?定义   尽管术语?attention,saliency和gaze经常被相互替换使用,但是他们之间有更细微的描述他们的定义。   注意力attention是一个普遍概念,覆盖了影响选择机制的各个方面,无论他们是场景驱动的自下而上的机制或者是预期驱动的自上而下机制。   显著性saliency直觉上刻画了场景的一些部分,可能是物体或者区域,这些部分似乎相对他们的临近区域突出。术语“salient”?通常在自下而上的计算模型[18][14]中提及到。   Gaze,一个眼睛和脑的协调运动,通常被用作注意力在自然行为中的代名词。(见[99])。比如,一个人或者一个机器人必须和周围的物体进行交互,在场景中移动是控制注意点来执行任务。从这点讲,注意点控制同时集视觉,行为和注意力来执行感觉运动协调,这是某些特定行为(比如到达reaching和理解grasping)所必须的。 1.2?起源   很多注意模型的基础能够追溯到TreismanGelades[81],他们提出的“特征整合理论”陈述了那些视觉特征是重要的以及他们如何组合来在弹出式的和连续的搜寻任务中引导人们的注意力。Koch and Ullman[18]?提出了一个前馈模型来组合这些特征,并引入了saliency map的概念,saliency map?是表示场景位置突出性的地形图。他们同时引入了一个winner-take-all神经网络,这个网络选择最显著的位置,利用返回抑制机制使注意力焦点移向下一个最显著的位置。一些系统随即创建出来,利用相关模型来处理数字图像[15][16][17]。Koc

文档评论(0)

tiantiande + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档