计算机视觉现状以及发展前景.docVIP

下载本文档

757
0
约3千字
约 3页
2017-04-07 发布于重庆
举报
版权申诉

计算机视觉现状以及发展前景.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机视觉现状以及发展前景

计算机视觉的现状与发展前景二十年前，计算机的出现使工作场所出现革命化发展。直到现在，约75％的办公室工作通过计算机和互联网来实现。1990年，大约15％美国家庭拥有了一台计算机，现在增加到70％。计算机视觉(Computer v|si0n)一词最早出现在P．H．Westonl 975 年的论文中。计算机视觉是以视觉处理理论为中心，属于人工智能范畴的一个新领域。它也是以图像处理、模式识别、计算机技术和生理学心理学为基础的信息处理科学中的一个重要分支。计算机视觉技术集数字图像处理、数字信号处理、光学、物理学、几何学、应用数学、模式识别及人工智能等知识于一体，其应用已经涉及到计算几何、计算机图形学、图像处理、机器人学等领域。计算机视觉既是工程领域，也是科学领域中的一个富有挑战性重要研究领域。50年代就已经开始了。目前，三维物体及景物分析工作的重点在三维物体与自然景物的识 Ⅱ与分析上。80年代，在计算机视觉研究中占主导地位的是Mart教授提出的视觉计算理论框架，在这种框架下，Marr认为视觉可看做是三个层次的信息处理过程，而且要从计算理论、算法描述及硬件实现三个方面去实现三个层次的工作。三维物体识别研究自Mart教授创立视觉计算理论后取得了重大进展。这一理论的要点在于把视觉看成一个过程，它从外部世界的图像逐步产生对景物的三个层次的描述，即： a)初始简图— — 这是基本意义的灰度变动的局部几何性质，以线条勾画出的草图形式出现 b)二维半简图—— 该图主要描述物体可视面的表面方向和观察点到表面的距离} c)三维模型表示— — 这是物体形状的全部而清晰的描述。有人认为，Marr教授的视觉计算理论是肘计算机视觉研究的最杰出的贡献。 90年代，Rosenfeld认为应重视三个方面的工作，一是计算的鲁棒性问题，二是主动视觉(active vision)的研究，三是定性视觉的研究(qualitative vision)。有人把视觉定义为“根据获得的图像理解景物信息的处理过程，而计算机视觉主要是利用计算机提供的手段和方法去完成这一信息处理过程。具体包括：视觉信息的获取图像预处理、分割、描述、识别理解等几步工作。1965年，L．Roberts关于“三维物体的感知”一文提出了几种获取三维信息的基本方法。这些基本方法至今还被计算机视觉研究领域普遍采用。目前，获取视觉信息的主要方法有主动法和被动法两大类，主动法需要对测试物体加入特殊的人造光源其中包括：三角光法、结构光法和飞行时间法。三角光法类似三角测量法，此法需逐点测量，费时较多。结构光法是把已知结构的图像投影到被渊物体表面，由于该物体表面的取向不同，标准图案会产生畸变，利用这畸变可算出物体表面的三维坐标。标准图像一般用细线、方格等。这种方法最早由日本学者Y．Shirai提出，具体做法可采用激光扫描或投影仪来实现。飞行时间测距法是以雷达原理为基础的方法。这种方法可直接测得物体表面距离而获得三维信息，它不涉及图像处理问题。具体实现可采用激光雷达或超声雷达，超声雷达的缺点是聚焦比较困难，但是处理方法比较简单。被动法是在自然光条件下获得三维信息的方法。其中包括：体视法、阴影恢复形状法、由运动恢复形状法、纹理恢复形状和灰度体视法等。体视法与人的视觉原理有许多相似之处，由不同位置上的摄像机获取两幅(或多幅)图像，根据三角测量原理，利用立体图像中的对应点的视差计算出景物的三维信息。因此，两幅图像的匹配是体视法的关键。早期的匹配主要基于区域的灰度相关计算，现代方法则侧重于特征匹配。因而，只能获得稀疏的特征信息，要用各种内插法获取整幅图像的三维信息。体视法体现了Marr教授的理论精髓。形状分析法是根据图像中灰度阴影分布、物体的运动、纹理结构等信息分析计算景物的三维信息。运动序列图像分析法是依靠物体或摄像机运动时得到多幅序列图像，通过对三维运动参数的计算分析获取三维信息。此方法基本属于形状分析法，它在计算机视觉研究中较受重视，已成为一个重要分支。总之，三维信息获取是计算机视觉研究的基础，也是目前非常活跃的课题之一。无论在理论上还是实践上都有举足轻重的作用三维信息获取中的重要环节—— 三维定标系统研究也是极受重视的课题。为提高定标的精度曾做了大量的研究工作，并提出了不少算法。在摄影测量严密解析法研究中Faig口、Browm Ezs]Sobel[2 分别提出了不同的待定参数的算法。计算机视觉信息的处理技术主要依赖于图像处理方法，它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后。输出图像的质量得到相当程度的改善，既改善了图像的视觉效果．又便于计算机对图像进行分析、处理和识别。a)数据驱动的分割常见的数据驱动分割包括基于边缘检测的分割，基于区域的分割