手写数字体识别的支持向量机方法.docVIP

  • 59
  • 0
  • 约5.25千字
  • 约 16页
  • 2021-10-31 发布于江苏
  • 举报
手写数字体识别的支持向量机方法 ———————————————————————————————— 作者: ———————————————————————————————— 日期: 基于支持向量机的手写数字识别 第一章 绪论 数字识别概述 阿拉伯数字是人类文明的标志之一,也是人们进展交流与沟通的主要媒介。数字作为世界经济开展的信息载体,展示了世界各族人民的思维和认知方式。在我们的日常生活中,每天都要进展大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。 计算机文字识别,是计算机和人之间进展信息沟通的一座桥梁。计算机文字识别一直是图像识别领域中十分活泼的研究课题。它被认为是典型的图像识别应用研究课题。随着信息时代的到来,如何实习数字识别的自动识别与处理将直接关系到我国信息事业的开展。数字识别是一种类别的识别问题,在理论和技术上都具有较大的研究价值。其中,数字识别特别是手写数字识别因其需要较高的识别精度和较快的识别速度被视为识别领域中“最难的领域〞,成为国内外研究的热点。 数字识别的问题和困难 数字的类别只有十种,笔划也比拟简单,其识别问题似乎不是很困难,但事实上,一些测试结果说明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如连机手写提汉字识别率高。这其中的主要原因如下: 手写数字字形相差不大,比方“1〞和“7〞,“3〞和“ 8〞很相似,使得准确区分某些数字相当困难; 在实际应用中,对数字识别单字识别正确率的要求要比文字要苛刻得多。这是因为,数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及的财会、金融领域其严格性使其准确率要求更高。此外,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度过低的方法行不通的。因此研究高性能的数字识别算法是一个有相当的挑战性的任务。 第二章 数字识别技术 数字识别是图像内容识别的一个应用领域,且有被识别的数较少,只有十个数字,阿拉伯数字笔画少的特点。所以手写阿拉伯数字的识别采用的方法相对于人脸识别、汉字识别等应用领域来说可以采用更为灵活的方法,例如基于神经网络的BP学习算法、SVM方法等。但无论使用那种方法,都需要通过根本的图像处理技术来对图像进展预处理,才能获得这些方法的输入信息。下面我们来介绍这两种方法。 神经网络的BP学习算法 神经网络是模拟人脑内部构造,在模拟推理、自动学习等方面接近人脑的自组织和并行处理的数学模型,包括输入层、隐含层、输出层。其优点之一是,不依赖于对象,通过学习将输入、输出以权值的方式编码,把它们联系起来。神经网络在数据挖掘中的优势是:噪声数据的强承受能力,对数据分类的高准确性,以及可用各种算法进展规那么提取。因此,常常借助神经网络来进展数据挖掘。 BP学习过程可以描述如下: 1〕工作信号正向传播。输入信号从输入层经隐单元,传向输出层,在输出端产生输出信号,这是工作信号的正向传播。在信号的向前传递过程中网络的权值是固定不变的,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,那么转入误差信号方向传播。 2〕误差信号方向传播。网络的实际输出与期望输出之间的差值即为误差信号,误差信号由输出端开场逐层向前传播,这是误差信号的反向传播。在误差信号方向传播的过程中,网络的权值由误差反应进展调节。通过权值的不断修正使网络的实际输出更接近期望输出。 工作信号 工作信号 误差信号 图为多层感知器的一局部,其中有两种信号:一是用实线表示的工作信号,工作信号正向传播;二是用虚线表示的误差信号,误差信号反向传播。 SVM算法 SVM方法定义最优线性超平面,并把寻找最优线性超平面的算法归结为求解一个凸规划问题。进而基于Mercer核展开定理,通过非线性映射φ,把样本空间映射到一个高维乃至于无穷维的特征空间〔Hilbert空间〕,使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。 简单地说就是升维和线性化。升维,即是把样本向高维空间做映射,一般只会增加计算的复杂性,甚至会引起“维数灾〞,因而人们很少问津。但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间却可以通过一个线性超平面实现线性划分〔或回归〕。SVM的线性化是在变换后的高维空间中应用解线性问题的方法来进展计算。在高维特征空间中得到的是问题的线性解,但与之相对应的却是原来样本空间中问题的非线性解。 一般的升维都会带来计算的复杂化。SVM方法巧妙地解决了这两个难题:由于应用了核函数的展开定理,所以根本不需要知道非线性映射的显式表达式;由于是在

文档评论(0)

1亿VIP精品文档

相关文档