- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于图像处理的机器人视觉相关技术研究
一、引言
视觉是人类获取信息最丰富的手段,通常人类75%以上的信息来自眼睛,而对于驾驶员来说,超过90%的信息来自于视觉。同样,视觉系统是机器人系统的重要组成部分之一,视觉传感器也是机器人获得周围信息的感知器件。
当机器人在特定环境下作业,且区域面积较大时,单目视觉不能满足机器人导航需求,需要将多幅图像拼接起来形成一幅大视场图像,以便机器人能够在相应环境下进行快速和准确作业。随着图像拼接技术的发展,图像拼接技术开始逐渐在机器人行业得到广泛应用。在移动机器人领域,利用视觉系统采集的具有重叠区域图像进行拼接形成大视角的图像,可以更加准确的分析现场情况,为机器人作业提供帮助。
本文将对机器视觉中应用到的图像格式转换与图像拼接技术进行阐述。
二 图像格式转换
机器人的视觉系统是由摄像头或???CMOS/CCD等图像感应器组成,图像传感器能将捕捉到的光源信号转化为数字信号,存储为RAW格式文件, RAW文件是一种记录了数码相机传感器的原始信息,同时记录了由相机拍摄所产生的一些原数据(Metadata,如ISO的设置、快门速度、光圈值、白平衡等)的文件。RAW是未经处理、也未经压缩的格式,可以把RAW概念化为“原始图像编码数据”。对RAW文件的处理不方便看到相应具体效果,本文处理方式是将原始数据文件格式转换成方便处理的图像格式再处理。
目前比较流行的有多种图像文件格式,典型的有BMP、GIF、TIFF、JPEG等,图像的文件格式在图像处理中有着重要的作用,其中BMP图像格式应用最广泛,本节将简要介绍BMP图像文件格式。
BMP(Bitmap File)是一种Windows采用的点阵式图像文件格式,主要由位图文件头、位图信息头、位图调色板以及位图数据四个部组成。结构如表1所示:
表1 BMP位图文件组成
位图文件组成标示名称作用与用途头文件BITMAPFILEHEADER文件类型与数据启示位置等信息头BITMAPINFORMATION位图大小与长、宽、高等信息调色板RGBQUAD由颜色格式确定调色板数组位图数据BYTE位图数据,确定压缩格式等BMP位图文件的第四部分是实际的图像数据。对于具有调色板的位图,图像数据就是该像素在调色板中的索引值。对于2色黑白图像,每个字节可以表示8个像素,对于16色像素,每个字节可以表示两个像素,对于256色像素,每个字节可以表示一个像素。
其中,图像的位图数据是按行存储的,每一行的字节数按照4B边界对其,也即每一行的字节数是4的倍数,不足的字节用0来补齐。图像的位图数据是按 行从下到上、从左到右来排列的。也就是说,从图像的位图数据中最先读到的是图像最下面一行最左边的像素,然后读到该行左边的第二个像素……,接着读到倒数第二行最左边的像素,紧接着倒数第二行第二个像素,以此类推,最后读到图像上第一行最右边的像素。这也是图像在显示器中显示的顺序。
将原始RAW格式文件按照一定规则添加相应的头文件以及相应的信息头等,能将原始RAW文件转换成BMP格式位图文件。转换前后文件如图1所示。
图1 图像数据采集与转化结果
三、图像拼接
通过图像拼接技术,可以扩展图像的分辨率,得到宽视角的图像。在平时的日常生活中,使用普通相机来获取宽视野的场景时,必须通过调节相机的焦距,才能拍摄到完整的场景,但是获得的全景照片分辨率相对降低。另外,由于距离原因是限制,一些大尺寸物体是无法用一张照片拍摄下来的。为了确保图像分辨率的条件下获取大视野范围的场景图片,人们提出图像拼接技术,将图像进行无缝拼接。例如,在微小型履带式移动机器人导航系统中,单目视觉不能满足机器人是视觉导航需要,利用图像处理技术,将机器人双目采集的图像进行拼接,可以增大机器人的视野,给机器人的视觉导航提供方便。
其中,图像拼接是一个多步骤的过程,大体上看,可以分为图像获取、图像预处理、图像配准、图像融合等步骤。由于采取的方法各不相同,不同方法间步骤也有较大的不同,但总体过程相差无几。图像拼接的流程图如图2所示。
图2 图像拼接基本流程
3.1 图像预处理
由于图像采集过程中环境光线和摄像机本身成像质量以及格式转换等因素的影响,有外界的噪声加入到图像中,使图像会发生不同程度的失真。因此对所采集到的图像进行处理前,需要先对图像噪声进行平滑除噪操作。由于我们只要求选择有突出感兴趣的特征,衰减不需要的特征,故预处理后的图像并不需要去逼近原图像,预处理后的图像并不考虑图像的降质,目前预处理方法主要是去噪,高斯去噪算法比较常用。
高斯滤波器是根据高斯函数的形状来选择权值的线性平滑滤波器。高斯平滑滤波器对去除服从正态分布的噪声有很好的效果。一维高斯函数为 其中的σ决定了高斯滤波器的宽度。对图
文档评论(0)