计算机视觉技术.docx

下载文档 降价啦

9
0
约5.88千字
约 11页
2017-08-20 发布于湖北
举报
版权申诉
保障服务

计算机视觉技术.docx

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机视觉技术

目录1立体视觉11.1计算机视觉技术12立体视觉技术32.1双目立体视觉技术3致谢8附录：9我的毕业论文排版样文1立体视觉1.1计算机视觉技术计算机视觉既是工程领域也是科学领域中的一个富有挑战性的重要研究领域。计算机视觉是一门综合性的学科，它已经吸引了来自各个学科的研究者参加到对它的研究之中，其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等[18]。视觉是各个应用领域，如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能自主系统中不可分割的一部分。由于它的重要性，一些先进国家，例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题，即所谓的重大挑战。“计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号，纹理和颜色建模，几何处理和推理，以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起[19]。”作为一门学科，计算机视觉开始于 60 年代初，但在计算机视觉的基本研究中的许多重要进展是在 80 年代取得的。现在计算机视觉已成为一门不同于人工智能、图象处理、模式识别等相关领域的成熟学科[20]。不少学科的研究目标与计算机视觉相近。这些学科包括图像处理、图像识别、景物分析、图像理解等。由于历史发展或领域本身的特点这些学科互有差别，但又有某种程度的相互重叠。为了清晰起见，把这些与计算机视觉有关的学科从研究目标和方法角度加以归纳[21]。（1）图像处理图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如，可通过处理使输出图像有较高的信噪比，或通过增强处理突出图像的细节，以便于操作员的检验。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。（2）图像识别图像识别技术根据从图像抽取的统计特性或结构信息，把图像分成预定的类别。在计算机视觉中图像识别技术经常用于对图像中的某些部分(例如分割区域)的识别和分类。（3）图像理解给定一幅图像，图像理解程序不仅描述图像本身，而且描述和解释图像所代表的景物，以便对图像代表的内容作出决定。在人工智能视觉研究的初期经常使用景物分析这个术语，以强调二维图像与三维景物之间的区别。图像理解除了需要复杂的图像处理以外还需要具有关于景物成像的物理规律的知识以及与景物内容有关的知识。在建立计算机视觉系统时需要用到上述学科中的有关技术，但计算机视觉研究的内容要比这些学科更为广泛。计算机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机视觉系统的目标需要建立人类视觉的计算理论。八十年代初，马尔(Marr)从神经生理学、心理物理学和临床神经病理学角度对人类视觉进行了系统的理论研究，并以此为根据提出了视觉计算三层表象理论，该理论是迄今为止最为系统的视觉理论，对神经科学的发展和人工智能的研究产生了深远的影响[21]。马尔的三个表象层次如图2-1 所示。Marr的计算视觉理论把视觉过程看作一个信息处理过程，并把这一过程分为三个层次：计算理论；算法与数据结构；硬件实现。这一理论强调计算理论层次，并根据Warrington[22]临床神经学的研究结果，阐明视觉目的是从图像中建立物体形状和位置的描述。在这一层次把视觉过程主要规定为从二维图像信息中定量恢复图像所反映的三维场景中物体的形状和空间位置，即三维重建。图1 视觉系统的三个表象层次在计算理论这一层次，Marr 将三维重建这一过程分为三个层次。前期视觉处理阶段是由输入的二维图像获得二维要素图，包括检测灰度变化，表示和分析局部几何结构以检测照明效应等处理。中期视觉处理阶段是对二维要素图进行一系列运算得到能反映可见表面几何特征的表象，即二维半(2.5 维)图。这些运算包括由立体视觉运算物体的深度信息；根据灰度、纹理等信息恢复表面方向；由运动视觉运算获取表面形状和空间关系信息等。后期视觉处理阶段是从二维半图像获取场景物体的三维描述，识别出场景中这些物体的位置和姿态。2立体视觉技术立体视觉是计算机视觉领域的一个重要课题，它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值，其应用包括移动机器人的自主导航系统，航空及遥感测量，工业自动化系统等。立体视觉的研究由如下几部分组成[24]：（1）图像获取用作立体视觉研究的图像的获取方法是多种多样的，在时间、视点、方向上有很大的变动范围，直接受所应用领域的影响。立体视觉的研究主要集中在三个应用领域中，即自动测绘中的航空图片的解释，自主车的导引及避障，人类立体视觉的功能模拟。不同的应用领域涉及不同类的景物，就场景特征的区别来分，可以划分成两大类，一类是含有文明特征的景物；另一类是含有自然特征的景物和表面。不同类的景物的图像处理方法大不相同。（2）图像匹配图像匹配是立体视觉