基于opencv的手写数字字符识别.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于OpenCV的手写数字字符识别 2013级 计算机软件与理论 摘要 本程序主要参照论文,《基于OpenCV的脱机手写字符识别技术》实现了,对于手写阿拉伯数字的识别工作。识别工作分为三大步骤:预处理,特征提取,分类识别。预处理过程主要找到图像的ROI部分子图像并进行大小的归一化处理,特征提取将图像转化为特征向量,分类识别采用k-近邻分类方法进行分类处理,最后根据分类结果完成识别工作。 程序采用Microsoft Visual Studio 2010与OpenCV2.4.4在Windows 7-64位旗舰版系统下开发完成。并在Windows xp-32位系统下测试可用。 主流程图: 细化流程图: 预处理 预处理的过程就是找到图像的ROI区域的过程,如下图所示: 首先找到数字的边界框,然后大小归一化数字图片,主要流程如下图所示: 主要代码: IplImage preprocessing(IplImage* imgSrc,int new_width, int new_height) { IplImage* result; IplImage* scaledResult; CvMat data; CvMat dataA; CvRect bb;//bounding box CvRect bba;//boundinb box maintain aspect ratio //Find bounding box找到边界框 bb=findBB(imgSrc); cvGetSubRect(imgSrc, data, cvRect(bb.x, bb.y, bb.width, bb.height)); int size=(bb.widthbb.height)?bb.width:bb.height; result=cvCreateImage( cvSize( size, size ), 8, 1 ); cvSet(result,CV_RGB(255,255,255),NULL); //将 int x=(int)floor((float)(size-bb.width)/2.0f); int y=(int)floor((float)(size-bb.height)/2.0f); cvGetSubRect(result, dataA, cvRect(x,y,bb.width, bb.height)); cvCopy(data, dataA, NULL); //Scale result scaledResult=cvCreateImage( cvSize( new_width, new_height ), 8, 1 ); cvResize(result, scaledResult, CV_INTER_NN); //Return processed data return *scaledResult;//直接返回处理后的图片 } 特征提取 在拿到ROI图像减少了信息量之后,就可以直接用图片作为向量矩阵作为输入: void basicOCR::getData() { IplImage* src_image; IplImage prs_image; CvMat row,data; char file[255]; int i,j; for(i =0; iclasses; i++)//总共10个数字 { for( j = 0; j train_samples; j++)//每个数字50个样本 { //加载pbm格式图像作为训练 if(j10) sprintf(file,%s%d/%d0%d.pbm,file_path, i, i , j); else sprintf(file,%s%d/%d%d.pbm,file_path, i, i , j); src_image = cvLoadImage(file,0); if(!src_image) { printf(Error: Cant load image %s\n, file); //exit(-1); } //process file prs_image = preprocessing(src_image, size, size); //生成训练矩阵,每个图像作为一个向量 cvGetRow(trainClasses, row, i*train_samples + j); cvSet(row, cvRealScalar(i)); //Set data cvGetRow(trainData, row, i*train_sam

您可能关注的文档

文档评论(0)

liyxi26 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档