基于opencv的手写数字字符识别.docVIP

下载本文档

10
0
约3.53千字
约 9页
2016-01-10 发布于安徽
举报
版权申诉

基于opencv的手写数字字符识别.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于OpenCV的手写数字字符识别 2013级计算机软件与理论摘要本程序主要参照论文，《基于OpenCV的脱机手写字符识别技术》实现了，对于手写阿拉伯数字的识别工作。识别工作分为三大步骤：预处理，特征提取，分类识别。预处理过程主要找到图像的ROI部分子图像并进行大小的归一化处理，特征提取将图像转化为特征向量，分类识别采用k-近邻分类方法进行分类处理，最后根据分类结果完成识别工作。程序采用Microsoft Visual Studio 2010与OpenCV2.4.4在Windows 7-64位旗舰版系统下开发完成。并在Windows xp-32位系统下测试可用。主流程图：细化流程图：预处理预处理的过程就是找到图像的ROI区域的过程，如下图所示：首先找到数字的边界框，然后大小归一化数字图片，主要流程如下图所示：主要代码： IplImage preprocessing(IplImage* imgSrc,int new_width, int new_height) { IplImage* result; IplImage* scaledResult; CvMat data; CvMat dataA; CvRect bb;//bounding box CvRect bba;//boundinb box maintain aspect ratio //Find bounding box找到边界框 bb=findBB(imgSrc); cvGetSubRect(imgSrc, data, cvRect(bb.x, bb.y, bb.width, bb.height)); int size=(bb.widthbb.height)?bb.width:bb.height; result=cvCreateImage( cvSize( size, size ), 8, 1 ); cvSet(result,CV_RGB(255,255,255),NULL); //将 int x=(int)floor((float)(size-bb.width)/2.0f); int y=(int)floor((float)(size-bb.height)/2.0f); cvGetSubRect(result, dataA, cvRect(x,y,bb.width, bb.height)); cvCopy(data, dataA, NULL); //Scale result scaledResult=cvCreateImage( cvSize( new_width, new_height ), 8, 1 ); cvResize(result, scaledResult, CV_INTER_NN); //Return processed data return *scaledResult;//直接返回处理后的图片 } 特征提取在拿到ROI图像减少了信息量之后，就可以直接用图片作为向量矩阵作为输入: void basicOCR::getData() { IplImage* src_image; IplImage prs_image; CvMat row,data; char file[255]; int i,j; for(i =0; iclasses; i++)//总共10个数字 { for( j = 0; j train_samples; j++)//每个数字50个样本 { //加载pbm格式图像作为训练 if(j10) sprintf(file,%s%d/%d0%d.pbm,file_path, i, i , j); else sprintf(file,%s%d/%d%d.pbm,file_path, i, i , j); src_image = cvLoadImage(file,0); if(!src_image) { printf(Error: Cant load image %s\n, file); //exit(-1); } //process file prs_image = preprocessing(src_image, size, size); //生成训练矩阵，每个图像作为一个向量 cvGetRow(trainClasses, row, i*train_samples + j); cvSet(row, cvRealScalar(i)); //Set data cvGetRow(trainData, row, i*train_sam