手写印刷体汉字的笔段抽取及偏旁识别.pdfVIP

下载本文档

7
0
约1.16万字
约 6页
2019-11-30 发布于天津
举报

手写印刷体汉字的笔段抽取及偏旁识别.pdf

中文信息学报第卷第期手写印刷体汉字的笔段抽取及偏旁识别胡家忠武汉工业大学【】本文采用对汉字点阵图行方向变的方法汉字的笔 , 用结构摘要象进攘抽取段采分析的方法识别分布于汉字四周的偏旁, 对国标一级汉字中的卯类偏旁计一万余字进行了偏旁抽取试验, 当侯选偏旁数万时 , 累计正确侯补率好一、目舀、写印汉别的重由于的字多杂 , 手刷体字识别是模式识中一个要课题汉字数结构复为了高速地识别每一个扫描输人的汉字 , 笔者认为采用三级分类识别的方法较好即首先按分布于汉字四周局部区域的偏旁进行第一级粗分类 , 接着按四周外围特征进行第二级细。分类, 最后进行逐字详细识别我们知道, 汉字的结构虽然复杂, 但汉字都是由直线线段构成的, 而且这些线段具有横、竖、擞、捺四个方向多数汉字约占具有偏旁, 这些偏旁分布于汉字四周的局部区域 , 并且由少数笔段组成相对汉字来说, 它们的种类少, 结构简单 , 因此 , 在进行逐字识别前, 如果能先识别它们的偏旁, 无疑是进行汉字识别的一条捷径采用传统匹方 , 于 , 变 , 的划少 , 之的模板配法由书写者书写风格各异字形化大再加上偏旁笔它们间的区别往往只有一笔之差 , 为了保证分类的精度, 不得不采用多个模板 , 选用多个侯补偏旁的办法来满足后级分类的需要 , 这样反过来又导至分类速度下降, 达不到分类既快又准的要求正因为偏旁分布于汉字四周的外围部分, 笔段比较容易提取 , 它们之间的区别往往在于少数笔划及其位置分布, 如果能够正确地提取分布于汉字四周的笔段 , 则采用结构分析的方法就能较好地识别汉字的偏旁本文介绍将输人汉字的点阵图象进行方向变换的方、法, 抽取汉字的笔段利用对各种偏旁的先验知识, 按照线段的长度方向及其相互位置关系进行分析判断, 达到正确抽取汉字偏旁的目的这种方法的优点是能够保存原始图象

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

手写印刷体汉字的笔段抽取及偏旁识别.pdfVIP