基于级联分类器手写体数字识别研究.docVIP

基于级联分类器手写体数字识别研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于级联分类器手写体数字识别研究

基于级联分类器手写体数字识别研究   摘要:以手写体数字的识别为研究中心,研究了针对手写体数字的特征提取和特征识别。利用像素点统计特征,图像结构交截特征,小波分析特征提取出了多维特征。介绍了级联分类的思想,引入拒识率的概念。提出了基于改进BP神经网络和支持向量机级联的手写体数字识别系统。实验验证,该方法能有效提高字符分类的识别率。   关键词:特征提取;小波分析;神经网络;支持向量机;级联分类   中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)20-0180-03   ABSTRACT:Taking handwritten numeral recognition as the research center, the feature extraction and feature recognition of handwritten numerals are studied. Based on the statistical characteristics of pixels, the cross section characteristics of image structure, the feature of wavelet analysis the feature is extracted. This paper introduces the idea of cascade classification, and introduces the concept of rejection rate. A handwritten numeral recognition system based on improved BP neural network and support vector machine cascade classifiers is proposed. Experimental results show that the proposed method can effectively improve the recognition rate of the character classification.   Key words: feature extraction , wavelet analysis, neural network , support vector machine , cascade classify   1 概述   手写数字识别是光学字符识别的一个重要组成部分,是模式识别的一个经典问题。其目的是将手写的阿拉伯数字扫描入计算机中,再通过所建立的模式识别系统,自动识别出所对应数字。手写体数字识别涉及多个学科,包括模式识别,统计决策,图像处理等等,是结合基础研究与应用研究的一门综合性技术。   2 手写体数字分类训练测试集的准备和评价指标   2.1 实验准备   本文的实验数据是基于 MNIST 手写数字图像集。该数据集是当前比较热门的,共包含 60,000 训练样本和 10,000 个测试样本。数据集中所有的手写数字图片的尺寸都标准化到 28×28 像素的大小,图像类型是 bmp 图片。提取出来的图片分别装在训练集和测试集两个文档里面,以备方便实验进行。但考虑到计算机的内存和性能问题,在训练集中我们分别对0到9个数字选取500张图片,共5000张图片;而在测试集中我们分别对0到9个数字选取200张图片,共计2000张图片。本文实验所使用的编程工具是 matlabR2011b 版本,基于 OpenCV(Open Source Computer Vision Library)视觉库开发。   2.2 评价指标   一般对分类性能的评价指标有正确识别率和误识率,两者相加应得到100%   (1)识别率:   识别率=正确识别样本数/全部样本数*100%   (2)误识率:   误识率=误识样本数/全部样本数*100%   3 预处理和特征提取   3.1 基于像素点的粗网格统计特征的提取   所谓的粗网格特征,我们把图像划分成n×n的网格,然后计算每个n*n的网格内白像素的个数,网格特征就用我们得到的这个数值来表示。传统的字符特征提取方法是将字符分割后的图像一次性地分为n×n的网格,然后分别统计出每个网格中字符所占像素点个数与网格像素点总数之比,最后得到n×n维的统计向量,将得到的n×n维统计量作为神经网络的输入量。由于不同的网格划分方式划分出的网格图像大小不同,造成网格图像有重叠,利用这种重叠特点对网格逐一进行特征提取,充分利用网格中字符所占像素点在网格中的分布位置特征,从单一字符图像中提取到更多的字符特征信息。本文对

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档