利用OpenCV测图像中的长方形画布或纸张并提取图像内容.doc

下载文档

3
0
约2.89千字
约 15页
2017-09-13 发布于江苏
举报
版权申诉
保障服务

利用OpenCV测图像中的长方形画布或纸张并提取图像内容.doc

1、本文档共15页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

利用OpenCV测图像中的长方形画布或纸张并提取图像内容

问题如下：也就是在一张照片里，已知有个长方形的物体，但是经过了透视投影，已经不再是规则的长方形，那么如何提取这个图形里的内容呢？这是个很常见的场景，比如在博物馆里看到一幅很喜欢的画，用手机找了下来，可是回家一看歪歪斜斜，脑补原画内容又觉得不对，那么就需要算法辅助来从原图里提取原来的内容了。不妨把应用的场景分为以下：也就是上面的左图中4个红点是可以准确获取，比如手动标注，那么就简单了：用OpenCV的Perspective Transform就可以。具体步骤如下： 1) 将标注好的四个点坐标存入一个叫corner的变量里，比如上面的例子中，原图的分辨率是300x400，定义x和y的方向如下：那么纸张的四角对应的坐标分别是：左上：157.6, 71.5 右上：295.6, 118.4 ? ? ? 右下：172.4, 311.3 ? ? ? 左下：2.4, 202.4 ? 把这四个坐标按如上顺序放到一个叫corner的变量里。如果我们打算把这幅图案恢复到一个300x400的图像里，那么按照对应的顺序把下面四个坐标放到一个叫canvas的变量里：左上：0, 0 右上：300, 0 右下：300, 400 ? ? ? 左下：0, 400 ? 假设原图已经用OpenCV读取到一个叫image的变量里，那么提取纸张图案的代码如下：把左图剪裁出来，去掉红点后试了试，结果如下：当然，其实这一步用Photoshop就可以了。。这种场景可能是小屏幕应用，或是原始图像就很小，比如我这里用的这个300x400例子，点坐标很难精确标注。这种情况下一个思路是，用边缘检测提取纸张四边，然后求出四角坐标，再做Perspective Transform。 ? 1) 图像预处理一般而言即使做普通的边缘检测也需要提前对图像进行降噪避免误测，比如最常见的办法是先对图像进行高斯滤波，然而这样也会导致图像变得模糊，当待检测图形边缘不明显，或是图像本身分辨率不高的情况下(比如本文用的例子)，会在降噪的同时把待检测的边缘强度也给牺牲了。具体到本文的例子，纸张是白色，背景是浅黄带纹路，如果进行高斯滤波是显然不行的，这时候一个替代方案是可以考虑使用Mean Shift，Mean Shift的优点就在于如果是像背景桌面的浅色纹理，图像分割的过程中相当于将这些小的浮动过滤掉，并且保留相对明显的纸张边缘，结果如下：原图处理后 Meanshift的代码：因为主要目的是预处理降噪，windows size和color distance都不用太大，避免浪费计算时间还有过度降噪。降噪后可以看到桌面上的纹理都被抹去了，纸张边缘附近干净了很多。然而这还远远不够，图案本身，和图像里的其他物体都有很多明显的边缘，而且都是直线边缘。 2) 纸张边缘检测虽然降噪了，可是图像里还是有很多边缘明显的元素。怎么尽量只保留纸张的边缘呢，这时候可以考虑用分割算法，把图像分为纸张部分和其他部分，这样分割的mask边缘就和纸张边缘应该是差不多重合的。在这里可以考虑用GrabCut，这样对于简单的情况，比如纸张或画布和背景对比强烈的，直接把图像边缘的像素作为bounding box就可以实现自动分割。当自动分割不精确的情况下再引入手动辅助分割，具体到我这里用的例子，背景和画面接近，所以需要手动辅助：结果如下：可以看到，分割后的结果虽然能基本区分纸张形状了，可是边缘并不准确，另外键盘和部分桌面没能区分开来。这时可以继续用GrabCut+手动标注得到只有纸张的分割。或者为了用户友好的话，尽量少引入手动辅助，那么可以考虑先继续到下一步检测边缘，再做后期处理。假设我们考虑后者，那么我们得到的是如下的mask：这个mask并不精确，所以不能直接用于边缘检测，但是它大致标出了图片里最明显的边缘位置所在，所以可以考虑下面的思路：保留降噪后位于mask边缘附近的信息用于真正的边缘检测，而把其他部分都模糊处理，也就是说基于上面得到的mask做出下面的mask用于模糊处理：基于这个mask得到的用于边缘检测的图像如下：用canny算子检测出边缘如下：对检测到的边缘使用Hough变换检测直线，我例子里用的是cv2.HoughLinesP，分辨率1像素和1°，可以根据图像大小设置检测的阈值和minLineLength去除大部分误检测。特别提一下的是如果使用OpenCV的Python binding，OpenCV 2和OpenCV 3的结果结构是不一样的，如果进行代码移植需要相应的修改。检测到的结果如下：可以看到，有些线几乎重合在一起了，这是难以避免的，上图中一共检测到9条线，其中两对（下、右边缘）重合。可以通过距离判断和直线相对角度来判断并把重合线段合为一条：剩下的都是没有重合的线了。那么如何选取纸张