- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于计算机视觉三维重建技术综述
基于计算机视觉三维重建技术综述
摘要:单目视觉三维重建技术是计算机视觉三维重建技术的重要组成部分,其中从运动恢复结构法的研究工作已开展了多年并取得了不俗的成果。目前已有的计算机视觉三维重建技术种类繁多且发展迅速,本文对几种典型的三维重建技术进行了分析与比较,着重对从运动恢复结构法的应用范围和前景进行了概述并分析其未来的研究方向。
关键词:计算机视觉;三维重建;单目视觉;从运动恢复结构法
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2017)01-0054-03
计算机视觉三维重建技术是通过对采集的图像或视频进行处理以获得相应场景的三维信息,并对物体进行重建。该技术简单方便、重建速度较快、可以不受物体形状限制而实现全自动或半自动建模。目前计算机视觉三维重建技术广泛应用于包括医学系统、自主导航、航空及遥感测量、工业自动化等在内的多个领域。
本文根据近年来的国内外研究现状对计算机视觉三维重建技术中的常用方法进行了分类,并对其中实际应用较多的几种方法进行了介绍、分析和比较,指出今后面临的主要挑战和未来的发展方向。本文将重点阐述单目视觉三维重建技术中的从运动恢复结构法。
1 基于计算机视觉的三维重建技术
通常三维重建技术首先需要获取外界信息,再通过一系列的处理得到物体的三维信息。数据获取方式可以分为接触式和非接触式两种。接触式方法是利用某些仪器直接测量场景的三维数据。虽然这种方法能够得出比较准确的三维数据,但是它的应用范围有很大程度上的限制。目前的接触式方法主要有CMMs、Robotics Arms等。非接触式方法是在测量时不接触被测量的物体,通过光、声音、磁场等媒介来获取目标数据。这种方法的实际应用范围要比接触式方法广,但是在精度上却没有它高。非接触式方法又可以分为主动和被动两类。
1.1 基于主动视觉的三维重建技术
基于主动视觉的三维重建技术是直接利用光学原理对场景或对象进行光学扫描,然后通过分析扫描得到的数据点云从而实现三维重建。主动视觉法可以获得物体表面大量的细节信息,重建出精确的物体表面模型;不足的是成本高昂,操作不便,同时由于环境的限制不可能对大规模复杂场景进行扫描,其应用领域也有限,而且其后期处理过程也较为复杂。目前比较成熟的主动方法有激光扫描法、结构光法、阴影法等。
1.2 基于被动视觉的三维重建技术
基于被动视觉的三维重建技术就是通过分析图像序列中的各种信息,对物体的建模进行逆向工程,从而得到场景或场景中物体的三维模型。这种方法并不直接控制光源、对光照要求不高、成本低廉、操作简单、易于实现,适用于各种复杂场景的三维重建;不足的是对物体的细节特征重建还不够精确。根据相机数目的不同,被动视觉法又可以分为单目视觉法和立体视觉法。
1.2.1 基于单目视觉的三维重建技术
基于单目视觉的三维重建技术是仅使用一台相机来进行三维重建的方法,这种方法简单方便、灵活可靠、使用范围广,可以在多种条件下进行非接触、自动、在线的测量和检测。该技术主要包括X恢复形状法、从运动恢复结构法和特征统计学习法。
(1)X恢复形状法。若输入的是单视点的单幅或多幅图像,则主要通过图像的二维特征(用X表示)来推导出场景或物体的深度信息,这些二维特征包括明暗度、纹理、焦点、轮廓等,因此这种方法也被统称为X恢复形状法。这种方法设备简单,使用单幅或少数几张图像就可以重建出物体的三维模型;不足的是通常要求的条件比较理想化,与实际应用情况不符,重建效果也一般。
(2)从运动恢复结构法。若输入的是多视点的多幅图像,则通过匹配不同图像中的相同特征点,利用这些匹配约束求取空间三维点的坐标信息,从而实现三维重建,这种方法被称为从运动恢复结构法,即SfM(Structure from Motion)。这种方法可以满足大规模场景三维重建的需求,且在图像资源丰富的情况下重建效果较好;不足的是运算量较大,重建时间较长。
目前,常用的SfM方法主要有因子分解法和多视几何法两种。1)因子分解法。Tomasi和Kanade[1]最早提出了因子分解法。这种方法将相机模型近似为正射投影模型,根据秩约束对二维数据点构成的观测矩阵进行奇异值分解,从而得到目标的结构矩阵和相机相对于目标的运动矩阵。该方法简便灵活,对场景无特殊要求,不依赖具体模型,具有较强的抗噪能力;不足的是恢复精度并不高。2)多视几何法。通常,多视几何法包括以下四个步骤:①特征提取与匹配。特征提取是首先用局部不变特征进行特征点检测,再用描述算子来提取特征点。Moravec[2]提出了用灰度方差来检测特征角点的方法。Harris[3]在Moravec算法的基础上,提出了利用信号的基本特性来提取图像角点的Harri
原创力文档


文档评论(0)