基于注意机制的自我学习的视觉系统分析及其应用-visual system analysis of self-learning based on attention mechanism and its application.docxVIP

下载本文档

7
0
约3.74万字
约 40页
2018-08-14 发布于上海
举报
版权申诉

基于注意机制的自我学习的视觉系统分析及其应用-visual system analysis of self-learning based on attention mechanism and its application.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于注意机制的自我学习的视觉系统分析及其应用-visual system analysis of self-learning based on attention mechanism and its application

第一章绪论§1-1课题研究的背景及意义人类通过不断的从外界获取感知信息逐步提高对外界的认识，其中 80%以上的人类感知信息是通过视觉感知方式来获得。因此基于视觉的智能研究最早得到发展，其理论与应用研究逐步成为学术领域及工业领域关注的热点，并且已由单一的机器人研究逐步应用到工艺检测及识别系统中，取得了较满意的应用效果。目前，常用的视觉物体识别方法主要有两类：仿生学法和工程方法[1]。前者模拟人类视觉系统结构，以生物视觉系统研究中常用的神经生理学、心理学和认知科学等学科为基础建立处理模块实现视觉识别；后者只考虑系统的输入输出而忽略其他系统流程及具体细节，着眼于系统实现，总结并采用目前流行方法实现视觉识别功能。视觉识别和检测技术是目前理论研究中最热门的两个方面，然而目前实际应用于工业生产中的仅仅局限于传统的视觉图像处理技术和方法，大多数视觉系统的研究只是停留在理论研究领域或者仅能应用在特定的环境下完成特定的任务，系统应用适应性较差，而且，标定精度、模型精度和图像处理算法精度决定了应用的效果和精度，所以，如何进一步深入视觉识别理论研究特别是如何提高工业领域实际应用精度和效果，是研究者面临的巨大挑战。近年来，人们在视觉皮层信息处理以及自底向上的注意(bottom-up attention)引导理论研究方面取得了一些成绩并成功建立了一些模型。[2]但是，如何将注意集中在当前任务相关的显著的视觉要素上，以及如何理解自顶向下的注意(top-down attention)引导时，却遇到了很大困难。我们只是理解了在生物学中证实合理的一些复杂计算术语，而高层任务要求可能会帮助我们过滤大量的不相关的信息，但是关于这方面我们目前仍没有明确的计算理论支持，所以一个完整而合理的基于注意机制的神经计算理论框架有待于进一步的研究和建立。而且，在视觉模型的创建与应用中，传统的通用视觉模型（Marr 视觉计算理论[3]）首先要做的就是进行 3D 重建，进而去实现识别与理解过程。但是，它的计算模型是自下而上的、被动的，侧重于视觉信息表示的问题，从而选择忽略了视觉信息的获取和处理过程，尤其忽略了人在获取视觉信息时的主动性和选择性，所以该模型具有很大的局限性。而实际上，人眼的视网膜图像的采样本身是非均匀的，外界物体在人眼视网膜中图像呈现是中央密集而外周稀疏的，这就决定了视觉对外界的感知是一个主动的过程，在复杂背景中进行导航和进行识别通常都是视觉系统所要完成的任务。目前机器视觉的发展方向和研究热点就是主动视觉(Active Vision)或仿生视觉(Animate Vision)，即视觉是在一定任务下的主动过程，这一热点的核心问题就是选择性注意机制。同时，机器视觉理论与生物物理学、神经生理学、心理物理学和心理学等理论有着直接的联系，尤其是生物物理学和神经生理学的理论是当今许多学者研究的热点问题。以人类视觉的计算理论为基础，结合上述学科，建立与人类视觉系统相比拟的通用视觉系统是计算机视觉研究的最终目标，也是人类一直努力奋斗的目标，同时该目标的实现也必然会推动上述学科自身的发展。因此，视觉感知理论的不断探索及其如何较好的应用于类似人类神经处理方式的计算机视觉信息处理系统中意义重大。因此，本课题以选择性注意机制的计算模型为基础，然后引入神经网络知识，选择具有自主学习的自适应共振理论ART 神经网络对计算模型进行训练，并将其应用在人脸表情分类上。§1-2国内外发展概况很长时间以来，通过人们对计算机视觉的研究，就得到计算机视觉领域的突出特点是多样性和不完善性。后来直到上个世纪 70 年代，当计算机的性能提高到可以处理图像等这样大规模的数据时，计算机视觉才得到了正式的关注和发展，计算机视觉理论也在日渐成熟，在不同学科领域广泛应用，尤其是在计算机图像学中尤为突出。视觉研究是计算机图像学中必不可少的、很重要的组成部分，视觉研究发展于 20 世纪 70 年代，最早的视觉研究是使用模式识别研究方法取得了初步的发展，到上一世纪的 80 年代，视觉研究有了新的发展，研究中渐渐引入空间几何理论和物理知识等方法，并且取得了一定的进展。到上个世纪的 90 年代后，视觉研究有了迅猛的发展，随着智能机器人领域的崛起和发展，视觉研究进入了智能机器人视觉研究的阶段，此时很多新的方法和技术都可以用来进行视觉研究，例如不变量理论，融合技术和主动视觉理论等等。我们都知道，在计算机视觉研究领域，已故的英国科学家戴维（Marr）有着无可替代的地位，他提出的视觉计算理论以计算机科学为出发点，囊括了了众多学科的各个方面的重要研究成果，其中包括临床神经病理学，心理物理学，神经生理学等方面。他所提出的视觉计算理论是目前视觉研究领域中最全面最系统的理论，使计算机视