- 4
- 0
- 约4.81千字
- 约 3页
- 2018-05-09 发布于福建
- 举报
第 13卷第4期 西安文理学院学报:自然科学版 Vo1.13 No.4
2010年 10月 JournalofXi’anUniversityofArtsScience(NatSciEd) 0ct.2010
文章编号:1008-5564(2010)04-.0083-03
基于 Gabor变换与最近邻分类器的字符识别方法
杨彩霞
(宝鸡职业技术学院 经济管理系,陕西 宝鸡 721013)
摘 要 :光学字符识别中,特征提取与分类是最关键的步骤 ,文中采用 Gabor变换来提取图像特征,
结合最近邻分类器进行分类识别,实现了对中文字符的准确识别.实验表明,该方法具有较好 的抗干扰
性.
关键词 :Gabor;OCR;KNN
中图分类号 :TP391 文献标识码 :A
0 引言
汉字字符识别是当前图像研究的热点问题 ,在文字扫描录入、车牌识别等领域都有很重要的应用,
同时也是模式识别领域技术应用得最成功的一个分支.一个字符识别系统包括图像获取、预处理、特征
提取和选择、识别分类、后处理这四个部分.其中特征提取和选择、识别分类构成了字符识别的关键环
节.目前常用的特征提取方法有统计特征提取、结构(句法)特征提取方法 ¨和基于神经网络的方法 J.
本文利用 Gabor变换 J,建立了一种新的字符识别特征向量提取方法,该方法首先进行字符归一化处
理,其次进行 Gabor变换进行特征提取,最后使用最近邻分类器进行特征分类.实验结果表明本方法能
够较有效地提取出字符特征,并能有效地对字符进行分类.
1 预处理
对于需要识别的各类字符,由于字符的大小和位置对于字符特征提取、识别具有不同的影响,因此
需要对字符图像进行归一化处理.该过程包括位置归一化和大小归一化.
1.1 字符位置归一化
为了消除字符点阵位置上的偏差,需要将整个字符点阵图形移动到固定的位置上,这个过程被称为
位置归一化.对汉字而言,大多数汉字笔划分布比较均匀,质心归一化不会造成偏移,但对于个别汉字如
于、丁等字,分布不匀,质心归一化使字形部分超出点阵范围而计算失效,因此通常采用形心归一法.
1.2 字符大小归一化
对不同大小的字符字号的变化所引起的字符尺寸相差可能接近十倍,因此需要将字符大小进行归
一 化.本文中的方法是通过归一化图像中的像素对应在原图像中的点的位置来决定归一化图像中像素
点的灰度值,设厂(,Y)为原图像,g(。,Y。)为归一化后的图像 ,设(。,Y。)为g(·)中的任意一点,对应
于 ,Y)中的点(a,b),根据(a,b)的具体情况来表示g(。,Y。)中各点的值.归一化的图像中像素点和
原图像 中的像素点的映射公式为:
收稿 日期 :2010-05—20
作者简介:杨彩霞 (1962一 ),女,河南洛阳人 ,宝鸡职业技术学院经济管理系副教授.研究方向:汉字字符识别
西安文理学院学报:自然科学版 第13卷
瞎 c·
2 特征提取
Gabor变换是基于多通道、多分辨率分析的一种方法,能够很好地兼顾信号在时域和频域中的分辨
能力,在字符识别上,Gabor变换的识别特征能充分反映笔划结构在空间上的局域性,笔画的方 向性 以
及在频域上笔画与干扰的可分性等重要特征,因此本文使用Gabor变换来提取汉字字符特征.
特征提取变换采用灰度图像作为输入,计算出笔画方向.
本文使用的二维Gabor变换滤波器函数定义如下:
G(,y;z, )=G1(,Y)[cos(R)一exp(一or)]+iG1(,Y)sin(R) (2)
其中G(x,y): 。p[一 ], :丌,R:Axcos0+Aysi ,A: ,上式参数中z代表波
长, 代表方向.
Gabor滤波器对宽度为÷的线条最敏感,因此对于40×40的字符输入图像,滤波器的波长选为l0.
同时针对中文字符中笔画方向集中在0。,45。,90。,和145。这4个方向,因此选取这4个方向来计
原创力文档

文档评论(0)