- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HUNAN UNIVERSITY
课程
题目
学 生 姓 名
学 生 学 号
专 业 班 级
模式识别
基于知识库的手写体数字识别
学 院 名 称
2016 年 6 月 25 日
2
基于知识库的手写体数字识别 1 案例背景:
手写体数字识别是图像识别学科下的一个分支,是图像处理和模式识别研 究领域的重要应用之一,并且具有很强的通用性。由于手写数字的随意性很大, 如笔画粗细、字体大小、倾斜角度等因素都有可能直接影响到字符的识别准确 率,所以手写体数字识别是一个很有挑战性的课题。在过去的数十年中,研究 者们提出了许多识别方法,并取得了一定的成果。在大规模数据统计如例行年 检、人口普查、财务、税务、邮件分拣等应用领域都有广阔的应用前景。
本案例实现了手写阿拉伯数字的识别过程,并对手写数字识别的基于统计的方 法进行了简要介绍和分析。本文实现的手写字体识别程序具有手写数字图像读 取、特征提取、数字模板特征库以及识别功能。
2 理论基础:
2-1 手写字体识别方法:
手写体数字识别是一个跨学科的复杂问题,综合了图像处理、模式识别、 机器学习等多个领域的知识,其识别过程一般包含图像预处理、特征提取、分 类器的设定及其后处理等组成。处理流程如图 2-1 所示。
图 2-1 手写体数子识别流程图
2-2 图像预处理
手写体数字识别的首要工作是图像预处理。在图像预处理过程中需要解决
3
的主要问题有:定位、图像二值化、平滑化(去噪)H J、字符切分、规范化等。 图像二值化是指将整个图像呈现出明显的黑白效果。待识别的手写体数字图像 在扫描过程中,常会带来一些噪声,用不同的扫描分辨率得到的数字图像,其 质量也各不相同,故而要先将这些干扰因素排除掉。另外,还需要正确分割整 幅文档图像中的手写体数字,而分割后的数字大小、字体常各不相同,故还需 进行归一化处理。
2-3 特征提取
特征提取的目的是从经过预处理后的数字图像中,提取出用以区分与其它 数字类别的本质属性并数值化,形成特征矢量的过程。常见的手写体数字特征 有:模板特征、统计特征、结构特征和变换特征。
2-4 分类器
不同的分类方式对应不同的分类器,可选的分类器有神经网络、支持向量 机等。利用训练出的分类器,对特征提取后的手写体数字进行分类识别。分类 器的识别原理是通过其拓扑结构和内置参数定义了特征空间上的一组曲面或超 曲面,利用这组曲面或超曲面将特征空间划分为不同的区域,从而达到分类识 别的目的。
2-5 算法流程
首先,读入手写数字图片进行归一化处理,统一尺寸。默认为 24×24 图形 块,并通过 ostu 算法进行二值化;其次,对二值化图像进行图像细化等形态学 操作,并按照算法要求进行特征提取;最后,载入模板矩阵进行对比,选用欧 式距离测度,得到识别结果。其算法流程如图 1 所示。
特征提取
根据手写数字图像本身的结构特征,通过计算端点、指定方向直线的交叉 点个数来作为特征向量。其主要步骤如下:
垂直交点。对细化后的手写数字图像分别在其列宽的 5/12、1/2、7/12 处生成垂直的三条直线,提取这三条垂直直线与数字笔画的角点数并存储。
水平交点。对细化后的手写数字图像分别在其列宽的 1/3、1/2、2/3 处 生成水平的三条直线,提取这三条垂直直线与数字笔画的角点数并存储。
对角交点。对细化后的手写数字图像分别提取两条对角直线,提取这两
4
条对角直线与数字笔画的交点数并存储。
由于以上步骤均作用于细化后的数字图像,其笔画简单且特征稳定,因此 对其提取的基本交点及结构端点能反映数字的本质特征,可快速、有效地识别 数字字符,并达到较好的识别正确率。其中,提取笔画结构端点特征的算法如 下。
目标定位。对细化后的手写数字图像按行从上到下、按列从左到右进行 顺序扫描,定位选择黑像素点 P 作为手写笔画目标。
邻域统计。计算黑色像素 P 的 8 领域之和 N,若 N=1,则像素 P 为端点, 端点计数器加 1;否则舍弃该点。
遍历图像。遍历整个图像,重复进行目标定位、领域统计的操作流程, 提取端点特征。依据上述对手写数字图像的交点、端点特征提取方法,本案例 中的特征向量 VEC 由 9 个分类组成,其排列如下:VEC=[垂直 5/12 处交点数, 垂直中线交点数,垂直 7/12 处交点数,
水平 1/3 处交点数,水平中线交点数,水平 2/3 处交点数,左对角线交点数, 右对角线交点数,端点数]
3 模式识别
本案例采用的是基于模式知识库的识别方法,所以系统调研的关键步骤就 是对数字字符的结构特征的分析及其模型的构造。因此,本案例首先对 0-9 这 10 个数字进行结构分析并建模,然后提取相关特征,最后构造模板库。
在实验过程中,我们选择规范手写和自由手写两组样本对知识库进行参数 调整,这些训
您可能关注的文档
最近下载
- 江苏省南通市如皋市2024-2025学年高三上学期9月第一次教学质量检测生物试题(解析版).doc VIP
- 《神经鞘瘤的诊断与治疗》课件.ppt VIP
- DB63_T 371-2001 蚕豆陵西一寸品种标准(青海省).pdf VIP
- 2024—2025学年江西省南昌市外国语学校教育集团九年级上学期10月学习质量检测化学试卷.doc VIP
- 第06课藤野先生(20张PPT).pptx VIP
- 青岛版2024-2025学年一年级数学上册第四单元《漂亮的粘贴画-11-20各数的认识》大单元教学设计.docx VIP
- 关于市民对“广州交警”微信使用情况调查(可编辑).doc VIP
- 画法几何之父蒙日.pdf VIP
- 高中课前三分钟的励志演讲稿.pptx
- 股市趋势技术分析—图解 (前人笔记非常详细).doc VIP
文档评论(0)