- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
印刷体数字识别的应用.ppt
印刷体数字识别的应用 印刷体数字识别是字符识别的一个分支,有多种方法,如模板匹配法、特征值提取法等。模板匹配法简单,但计算量很大,且费时;特征值提取法是基于特征的识别,关键是选取稳定且有效的特征,其计算量相对较小,识别速度快。 数字的类别只有十种,笔划又简单,其识别问题似乎不是很困难。但事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高,而只仅仅优于脱机手写体汉字识别。这其中主要原因是:某些数字字形相差不大(譬如:手写体5和3),使得准确区分某些数字相当困难 一般来说,用于数字识别的分类特征应满足 以下要求: (1)具有较强的分类能力,即该特征对不同的数字应表现出较大的差异,而对相同的数字则应表现出尽可能小的差异。 (2)具有较高的稳定性和抗干扰性,对数字的平移、旋转和尺度变换不敏感,受数字笔划断裂或粘连的影响尽可能小。 (3)特征向量应便于提取,算法要尽量简便,在保证识别系统的性能的条件下,特征向量的维数不能过高,以减少机器开销,提高运算速度。 数字与其它要素的自动分离技术又是实现数字的自动识别的重要前提和基础 噪声恶化了图像质量,使图像模糊,甚至淹没特征,给分析带来困难,消除图像噪声的工作称之为图像平滑或滤波。 中值滤波器是最常用的非线性平滑滤波器。它是一种邻域运算,类似于卷积,但计算的不是加权求和,而是把邻域中的像素按灰度级进行排序,然后选择该组的中间值作为输出像素值。 具体步骤是: (1)将模板在图像中漫游,并将模板中心与图像中某个像素的位置重合。 (2)读取模板下各对应像素的灰度值。 (3)将这些灰度值从小到大排成一列。 (4)找出这些值里排在中间的一个。 (5)将这个中间值赋给对应模板中心位置的像素。 中值滤波器的主要功能就是让与周围像素灰度值的差比较大的像素改取与周围的像素值接近的值,从而可以消除孤立的噪声点。它在衰减噪声的同时不会使图像的边界模糊。 中值滤波器去噪声的效果依赖于两个要素:邻域的空间范围,中值计算中所涉及的像素数。一般 来说,小于中值滤波器面积一半的亮或暗的物体基本上会被滤掉,而较大的物体则几乎会原样地保存下来,因此中值滤波器的空间尺寸必须根据具体的问题来进行调整。N*N模板n一般是奇数。 二值化对景物分析、模式识别等具有重要的意义。基于阈值的二值化算法,通过最大类间方差法即OTSU方法,统计图像的灰度直方图选取全局阈值,然后进行二值化处理。 Otsu算法步骤如下:设图象包含L个灰度级(0,1…,L-1),灰度值为i的的象素点数为Ni ,图象总的象素点数为N=N0+N1+...+N(L-1)。灰度值为i的点的概率为:P(i) = N(i)/N.门限t将整幅图象分为暗区c1和亮区c2两类,则类间方差σ是t的函数:σ=a1*a2(u1-u2)^2 式中,aj 为类cj的面积与图象总面积之比,a1 = sum(P(i)) i-t, a2 = 1-a1; uj为类cj的均值,u1 = sum(i*P(i))/a1 0-t,?u2 = sum(i*P(i))/a2, t+1-L-1?该法选择最佳门限t^ 使类间方差最大,即:令Δu=u1-u2,σb = max{a1(t)*a2(t)Δu^2} 模板就是一幅已知的小图像。模板匹配就是在一幅大图像中搜寻目标,已知该图中有要找的目标,且该目标同模板有相同的尺寸、方向和图像,通过一定的算法可以在图中找到目标,确定其坐标位置。 设T为M ×N的模板,将其叠放在被搜索图S(W ×H个像素)上并平移,模板覆盖被搜索图的那块区域叫子图Sij。i、j为子图左上角在被搜索图S上的坐标。搜索范围是:1 ≤i ≤H -N,1 ≤j ≤W -M。 通过比较T和Sij的相似性,完成模板匹配过程。 传统的模板匹配过程,是取模板的逐行逐列数据,即整个模板的数据,在被搜索图上进行逐行逐列扫描匹配,由于参与比较的数据量大,所以匹配速度很难提高。 如果只取模板的隔行隔列数据,在被搜索图上进行隔行隔列扫描匹配,匹配速度明显提高,不过匹配精度会有少许下降。 同一数字在不同的位置或多或少存在一些差别,改进的模板匹配算法编程时,必须取一个误差阈值E0。匹配过程中,若模板中的某一点的灰度与子图Sij中的某一点灰度不同,就把E (i, j)的值增加1,每匹配完一列(或者一行)时,就把E (i, j)与E0进行比较,当E (i, j )≥ E0时就停止该点的计算,继续下一点计算,这样可以提高算法的效率;当E (i, j ) E0时,就记录下该点的位置,并把匹配数目增加1。当整个匹配过程结束时,根据记录的匹配位置和匹配数目,便能将匹配数字标示出来 模板匹配中标示出来的数字,经过裁剪,变成一幅幅小数字图片。这些图片中除了有数字以外
您可能关注的文档
- 七年级英语上unit3sectiona课件 人教版新目标.ppt
- 云计算(第三讲).ppt
- 万科-三对眼睛学营销.ppt
- 中国古建基本知识1.ppt
- 七年级地理下册复习期中2.ppt
- 中国古建基本知识2.ppt
- 云计算在中国的应用前景.ppt
- 云计算(定版).ppt
- 云计算的技术挑战1.ppt
- 云计算解决方案2012年最新版--华为公司.ppt
- 2025年二级稳压装置项目发展计划.docx
- 2025年宁夏艺术职业学院高职单招数学历年(2016-2024)频考点试题含答案解析.docx
- 2025铁缺乏症和缺铁性贫血诊治和预防的多学科专家共识(完整版).pdf
- 2025年宁夏财经职业技术学院高职单招语文2018-2024历年参考题库频考点含答案解析.docx
- 2025年宁夏财经职业技术学院高职单招职业适应性测试近5年常考版参考题库含答案解析.docx
- 2025金融年度工作总结8篇 .pdf
- 2025年宁夏财经职业技术学院高职单招职业技能测验历年参考题库频考版含答案解析.docx
- 2025年海参合作协议书.docx
- 2025年冷箱项目合作计划书.docx
- 2025年烧结空心砖(粘土砖、页岩砖、煤矸石砖、粉煤灰砖)合作协议书.docx
文档评论(0)