OpenCV的基础光学字符识别(BasicOCRinOpenCV).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
OpenCV的基础光学字符识别(BasicOCRinOpenCV)汇编

/sununs11/article/details/7758239  HYPERLINK /damiles/basicOCR Github源码 From: HYPERLINK /2008/11/basic-ocr-in-opencv/ /2008/11/basic-ocr-in-opencv/ 在这个教程当中我们将完成一个基础的数字光学字符识别。这包括把一个手写的数字分类进它所属的类里。 为了完成它,们我将要使用我们之前的教程里所有学到的东西,我们将要使用简单的? HYPERLINK /?p=72 basic painter?和? HYPERLINK /?p=84 the basic pattern recognition and classification with openCV?两个教程。 在一个典型的模式识别分类器里,包括三个模块: 预处理(信号获取和滤波) 特征提取(特征向量的计算) 分类(特征向量的分类) 预处理(Preprocessing):在这个模块我们将要处理我们输入的图片,比如大小标准化,彩色图像灰度化等等。 特征提取(Feature extraction):在这个模块我们转换我们处理后的图像为一个特征向量以便于分类,它可能是像素矩阵转换成向量或者获取轮廓编码链的数据表示。 分类模块获取特征向量,并训练我们的系统或者说使用一个分类方法(比如knn)把输入的特征向量分类。 这个基础光学字符识别的流程图如下: 现在我们有由图片组成的一个训练集和一个测试集来训练和测试我们的分类器(knn)。 我们有1000张手写数字的图片,每个数字100张。我们使用每个数字的50张图片来训练,另外50张来测试我们的系统。 接下来我们要做的第一个工作就是对所有训练集的图片预处理,为了完成它我们创建一个预处理函数。在这个函数中,我们输入一张图片和我们想要它在处理后得到的新的长和宽,这个函数讲返回一个标准大小的带有边框的图片。你可以看到更多清楚的处理流程: 预处理代码:? void findX(IplImage* imgSrc,int* min, int* max){ int i; int minFound=0; CvMat data; CvScalar maxVal=cvRealScalar(imgSrc-width * 255); CvScalar val=cvRealScalar(0); //For each col sum, if sum width*255 then we find the min //then continue to end to search the max, if sum width*255 then is new max for (i=0; i imgSrc-width; i++){ cvGetCol(imgSrc, data, i); val= cvSum(data); if(val.val[0] maxVal.val[0]){ *max= i; if(!minFound){ *min= i; minFound= 1; } } } } void findY(IplImage* imgSrc,int* min, int* max){ int i; int minFound=0; CvMat data; CvScalar maxVal=cvRealScalar(imgSrc-width * 255); CvScalar val=cvRealScalar(0); //For each col sum, if sum width*255 then we find the min //then continue to end to search the max, if sum width*255 then is new max for (i=0; i imgSrc-height; i++){ cvGetRow(imgSrc, data, i); val= cvSum(data); if(val.val[0] maxVal.val[0]){ *max=i; if(!minFound){ *min= i; minFound= 1; } } } } CvRect findBB(IplImage* imgSrc){ CvRect aux; int xmin, xmax, ymin, ymax; xmin=xmax=ymin=ymax=0; findX(imgSrc, xmin, xmax); findY(imgSrc, ymin, ymax); aux=cvRect(xmin, ymin, xmax-xmin, ymax-ymin); //printf(BB: %d,%d - %d,%

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档