- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于SVM的手写数字识别系统2150230509文 成软件工程Introduction手写数字识别系统: 手写数字识别是符号识别的一个分支,虽然只是识别简单的10个数字,但却有着非常大的实用价值。 在我们的日常生活中,每天都要进行大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。另外随着平板电脑和触摸屏手机的普及,手写输入成为了很多人的主要输入方式。 手写数字虽然只有10个种类,但很多情况下对识别的精度要求非常高,而且每个人都有不同的字迹,要做到准确地识别还是有一定难度的。况且在实际应用中,手写数字识别的精确度要求要比汉字严格的多,因为数字识别经常用在财务、金融等领域。Literature review 目前解决该问题的技术已经相当成熟。 包括我们手机上的大部分输入法不仅支持数字的识别,而且支持汉字的识别,而且准确度也比较高。手写识别常见的例子:“SoGou拼音输入法”L1L2H1HH2Proposed methodSVM 支持向量机(是借助最优化方法来解决机器学习问题的新工具,是克服“维数灾难”和“过学习等传统困难的有力手段”)机理来源于解决分类问题:系统随机产生一个超平面,通过训练移动它,直到训练集合中不同的类别正好位于该超平面的不同侧面。支持向量机的机理是:寻找一个满足分类要求的最优分类超平面,即两侧空白空间最大化。SVM的特点与不足特点:(1)非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;(2)对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心;(3)支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。(4)SVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。(5)少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简单(6) SVM在小样本训练集上能够得到比其它算法好很多的结果。两个不足:(1) SVM算法对大规模训练样本难以实施(由于SVM是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算(m为样本的个数),当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间。)(2) 用SVM解决多分类问题存在困难(经典的支持向量机算法只给出了二类分类的算法,而在数据挖掘的实际应用中,一般要解决多类的分类问题。可以通过多个二类支持向量机的组合来解决。)手写数字识别的一般方法图像预处理SVM训练训练样本图像预处理识别器结果测试样本训练集:MNIST手写数字图片库(/archive/p/supplement-of-the-mnist-database-of-handwritten-digits/downloads)(总共提供60000个训练样本,每个数字提供6000个训练样本。另外提供1000个测试数据)训练样本压缩28*2810*10SVM训练//C++、opencv2.4 + SVM 实现//建立训练样本Mat trainingDataMat(x, x, CV_32FC1, trainingData); Mat labelsMat (x, x, CV_32FC1, labels);//设置SVM参数CvSVMParams params; params.svm_type = CvSVM::C_SVC; params.kernel_type = CvSVM::LINEAR; params.term_crit = cvTermCriteria(CV_TERMCRIT_ITER, 100, 1e-6);//训练支持向量机CvSVM SVM; SVM.train(trainingDataMat, labelsMat, Mat(), Mat(), params);10非1非0核函数的选择:核函数是SVM的核心,不同的核函数可以构造不同的SVM分类器,比如线性核函数,二次核函数和多项式核函数,径向基核函数等等。。。。(SVM最初设计出来是用于解决二分类问题的,多分类问题需将多个SVM的二分类器组合起来。)测试样本预处理压缩10*10实验演示(Windows)实现:C++、Opencv + SVM实验演示(Android)实验结果分析每个数字 100个训练样本,测试数据正确率80.21%(训练集太少)每个数字1000个训练样本,测试数据正确率95.45%(体现小样本高准确率的特性)每个数字6000个训练样本,测试数据正确率97.67% 当手写字体比较正式
您可能关注的文档
最近下载
- 译林版5年级上册英语全册教学课件(2022年12月修订).pptx
- 机械制造技术(第4版)第14章 机械制造工艺规程设计.ppt VIP
- 电磁振动排种器振动系统参数的确定.pdf VIP
- 《中国金融发展史》课件.ppt VIP
- HTN78A3_Datasheet_V0.1佰泰盛世科技.pdf VIP
- 一种排种器振动试验台.pdf VIP
- 西师版六年级上册数学(全册)课件.pptx VIP
- 北师大版小学三年级数学上册课件【全册】.pptx VIP
- 2025-2030原料药行业市场深度调研及前景趋势与投资研究报告.docx
- 机械制造技术第4版李华.电子教案42962第13章节机械制造工艺尺寸链幻灯片.ppt VIP
文档评论(0)