- 27
- 0
- 约1.5千字
- 约 9页
- 2018-04-15 发布于浙江
- 举报
[2018年最新整理]基于贝叶斯分类器的手写数字识别
基于贝叶斯分类器的手写数字识别
制作人:622081103001 姜晖
622081103003 张然
手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支。它研究的对象是:
如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。
研究的实际背景
在整个OCR领域中,最为困难的就是脱机手写字符的识别。
手写数字识别的应用范围广泛,阿拉伯数字组成的各种编号和统计数据如:邮政编码、统计报表、财务报表、银行票据等等。
研究的理论意义
阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关。
目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。
手写数字的识别方法扩展范围广。
研究的难度
一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高 。主要原因是:
1.不同数字之间字形相差不大,使得准确区分某些数字相当困难;
2.数字虽然只有十种,笔划简单,但同一数字 写法千差万别,全世界各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。
算法的理论基础
贝叶斯定理:
设设有N类样本:ω1,.......,ωN ,如果以
P(ωi)表示事件ωi发生的概率,且P(ωi)0(i=1
2,…,n)。对于任一事件x,P(x)0,则有:
P(ωj/x)=p(x/ωj)P(ωj)/∑P(X/ωi)P(ωi),其中P(x) = ∑P(X/ωi)P(ωi)
P(ωi)为先验概率, P(x/ωj)为条件概率,
P(ωj/x)后验概率。
贝叶斯分类器:
原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。也就是说,贝叶斯分类器是最小错误率意义上的优化。
贝叶斯分类器是用于分类的贝叶斯网络。该网络中应包含类结点C,其中C 的取值来自于类集合( c1 , c2 , ... , cm),还包含一组结点X = ( X1 , X2 , ... , Xn),表示用于分类的特征。对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为x = ( x1 , x2 , ... , x n) ,则样本D 属于类别ci 的概率P( C = ci | X1 = x1 , X2 = x 2 , ... , Xn = x n) ,( i = 1 ,2 , ... , m) 应满足下式:
P( C = ci | X = x) = Max{ P( C = c1 | X = x) , P( C = c2 | X = x ) , ... , P( C = cm | X = x ) }
而由贝叶斯公式:
P( C = ci | X = x) = P( X = x | C = ci) * P( C = ci) / P( X = x)
其中,P( C = ci) 可由领域专家的经验得到,而P( X = x | C = ci) 和P( X = x) 的计算则较困难。
谢谢观赏
WPS Office
Make Presentation much more fun
@WPS官方微博
@kingsoftwps
原创力文档

文档评论(0)